問題タブ [non-ascii-characters]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 正規表現のアクセントは鈍感ですか?
C#プログラムに正規表現が必要です。
特定の構造を持つファイルの名前をキャプチャする必要があります。
charクラスを使用しました\w
が、問題は、このクラスがアクセント付きのcharと一致しないことです。
では、これを行う方法は?理論的にはすべての文字にすべてのアクセントを付けることができるので、最もよく使用されるアクセント付きの文字をパターンに入れたくありません。
したがって、構文はあるかもしれませんが、大文字と小文字を区別しない(またはアクセントを考慮したクラス)か、大文字と小文字を区別できない正規表現オプションが必要です。
このようなことを知っていますか?
どうもありがとうございます
c - アサーションを与える isalpha()
ctype.h で標準ライブラリ関数 isalpha() を使用している C コードがあります。これは Visual Studio 2010-Windows 上にあります。以下のコードでは、char c が「£」の場合、isalpha 呼び出しは、以下のスナップショットに示すようにアサーションを返します。
これは、8 ビット ASCII にこの文字がないためであることがわかります。
では、ASCII テーブルの外でそのような非 ASCII 文字を処理するにはどうすればよいでしょうか?
私がやりたいのは、アルファベット以外の文字が見つかった場合(8ビットASCIIテーブルにない文字が含まれていても)、それを無視できるようにしたいということです。
php - 特殊文字(つまりウムラウト)をASCIIで最も可能性の高い表現に変換します
ウムラウトと特殊文字をASCIIで最も可能性の高い表現に変換する方法を知っているメソッドまたは変換テーブルを探しています。
例:
誰かアイデアはありますか?
更新:よく受け入れられた回答とは別に、PECLノーマライザーは非常に興味深いものでしたが、サーバーにないため、変更されていないため、使用できません。
また、ここでの回答が十分に役立たない場合は、この質問を確認してください。
vb.net - エンコーディング 737 混乱
私はVB .Net 2008を使用しています
Encoding.Convert
コマンドを使用して ASCII から 737 (ギリシャ語 DOS) に変換すると、読み取り可能な文字が返されるのに、 IO.StreamWriter
withを使用するEncoding.GetEncoding(737)
と読み取り不能な文字を含むファイルが書き込まれるのはなぜですか?
ギリシャ語を 737 として印刷できるプリンターに行データを送信したいので、これを尋ねています。 の結果を送信するとEncoding.Covert
、間違った結果が得られます。
c - ASCII 文字と非 ASCII 文字を含む文字列を反転します
この「abcd汉字efg」を含む文字列を逆にする方法について問題が発生しました。
復帰後は、次のようになります。
文字列を逆にするには、ASCII 以外の文字を特定する必要があると考えました。単純にすべてのバイトを逆にするだけでは正しい答えが得られないと思うからです。
どうすればいいですか?
PS: このプログラムは 32 ビットの Ubuntu で作成しました。次に、すべてのバイトを印刷しました:
「汉字」の代わりに意味不明なテキストが表示されました。
fonts - アクセント付きの文字は、貼り付けた後、奇妙に見えます(文字の後にアクセントが表示されます)
これが質問またはDoctypeに適した場所かどうかはわかりませんが、とにかく質問します...ドイツのクライアントと協力していて、この非常に奇妙な問題が発生し始めました。
そのため、Webサイトのコンテンツを入力しているときに、PDFシートからエディター(Espresso)にコピーして貼り付けます。奇妙なことは、すべてのテキストがエディター上で無垢に見える一方で、ブラウザーで開くと、アクセントのあるキャラクターのアクセントで奇妙な異常が発生し始め、前に押し出されることです。したがって、「Ö」はO"などとして表示されます。
ユニコードの問題だと思いましたが、サイトはutf8として宣言されており、リッチテキストなどは入力されておらず、エディターからの生のテキストです。ですから、それは本当に気が遠くなるようなことです。クライアントがファイルを直接編集する場合、ファイルは正しく表示されます。そして、アクセントのある文字を手動で入力して置き換えると、それも問題ないことがわかりました。
誰もが同様の経験/解決策を持っていましたか?
これらは本質的にラテン文字なので、ローカリゼーション/フォントの問題はないはずですが、私は持っているでしょうか?(私が間違っている場合は私を訂正してください)
c++ - この文字がプログラムを停止させるのはなぜですか?
改行文字はc ++で何らかの特別な意味を持っていますか? 非ASCII文字ですか?
大きなテキスト内の一意の n 文字の部分文字列ごとにマルコフ連鎖を構築しようとしています。新しい一意の部分文字列に遭遇するたびに、その値が 256 要素のベクトル (拡張 ASCII テーブルの文字ごとに 1 つの要素) であるマップに入力します。
ファイルの内容全体を出力しても問題ありません (「行」は、ifstream と getline を使用して作成されたテキスト行のベクトルです)。
テキスト ファイル全体がコンソールに表示されます。この問題は、char を予期している関数に改行文字を返そうとすると発生します。「moveSpaces」は、反復ごとに文字列のベクトル内で何文字先に移動するかを決定する整数定数です。
私はデバッガーを使いこなしましたが、2 行目の 1 列目に到達すると、エラーも何も発生しませんでした。呼び出し関数ではなく、この関数内で失敗します。
私が使用しているファイルは A Christmas Carol (Project Gutenberg で最初に登場したもの) です。参考までに、最初の数行を次に示します。
関数は、2 行目の最初の文字を返す必要があるときに中断します。これは、改行を削除した場合、またはプログラム内で「行」ベクトルを自分で 1 行ずつ作成した場合には発生しません。何が問題なのですか?
c# - .Net MVC 2、ファイル名に非ASCII文字を含むファイルを返す
私は、任意の言語でエクスポートできる必要があるデータエクスポートタスクに取り組んでいます。厳密にASCII文字を使用するすべての言語は問題なく動作しますが、東洋の言語でデータをエクスポートすると、次の例外がスローされます。「メールヘッダーに無効な文字が見つかりました」少し調べて、これを判断しました。これは、「78文字より長い、または非ASCII文字を含むパラメーター値は[RFC2184]で指定されているようにエンコードする必要がある」と述べているRFC2183仕様によるものです。
私はこれらのドキュメントの両方を読みましたが、あまり役に立ちませんでした。ファイルを見つけるには、UTF-8エンコードでデータを送信する必要があることを理解しています。ただし、これにより、ダウンロードされたファイル名がエンコードされたUTF-8として表示されます。今のところ、以下に投稿する関数を使用して、ファイル名をUTFにエンコードしています。(これはすべてC#、MVC2にあります)
そして、ファイルは次の関数で返されます。
厳密に言えば、これは機能します。ただし、ユーザーに到達すると、ファイル名全体がUTFエンコードになります。その既存のファイルをユーザーに返して、ASCII以外の文字を保持できるようにする方法を探しています。
どんな助けでも大歓迎です。
iphone - iPhoneでのASCII互換性についてキーボード入力を確認してください
ユーザーがキーボードをタップするとき、入力記号がASCIIパレットに属しているかどうかを知る必要があり、そうでない場合は削除します。
だから私がする必要があること
入力文字をチェックする方法は?
現在、ユーザーが(たとえば)ロシア語で入力すると、入力文字列からASCII文字を取得します。
windows - haskell:非ASCII文字を出力します
WinGHCiで非ASCII文字を出力したいのですが、これが私が得たものです:
私はWindowsXPでWinGHCi7.0.3を使用しています。WinGHCiが素敵な小さなデルタを印刷するにはどうすればよいですか?