問題タブ [non-ascii-characters]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
7 に答える
19905 参照

c# - 正規表現のアクセントは鈍感ですか?

C#プログラムに正規表現が必要です。


特定の構造を持つファイルの名前をキャプチャする必要があります。

charクラスを使用しました\wが、問題は、このクラスがアクセント付きのcharと一致しないことです。

では、これを行う方法は?理論的にはすべての文字にすべてのアクセントを付けることができるので、最もよく使用されるアクセント付きの文字をパターンに入れたくありません。

したがって、構文はあるかもしれませんが、大文字と小文字を区別しない(またはアクセントを考慮したクラス)か、大文字と小文字を区別できない正規表現オプションが必要です

このようなことを知っていますか?

どうもありがとうございます

0 投票する
3 に答える
4489 参照

c - アサーションを与える isalpha()

ctype.h で標準ライブラリ関数 isalpha() を使用している C コードがあります。これは Visual Studio 2010-Windows 上にあります。以下のコードでは、char c が「£」の場合、isalpha 呼び出しは、以下のスナップショットに示すようにアサーションを返します。

ここに画像の説明を入力

これは、8 ビット ASCII にこの文字がないためであることがわかります。

では、ASCII テーブルの外でそのような非 ASCII 文字を処理するにはどうすればよいでしょうか?

私がやりたいのは、アルファベット以外の文字が見つかった場合(8ビットASCIIテーブルにない文字が含まれていても)、それを無視できるようにしたいということです。

0 投票する
1 に答える
10781 参照

php - 特殊文字(つまりウムラウト)をASCIIで最も可能性の高い表現に変換します

ウムラウトと特殊文字をASCIIで最も可能性の高い表現に変換する方法を知っているメソッドまたは変換テーブルを探しています。

例:

誰かアイデアはありますか?

更新:よく受け入れられた回答とは別に、PECLノーマライザー非常に興味深いものでしたが、サーバーにないため、変更されていないため、使用できません。

また、ここでの回答が十分に役立たない場合は、この質問を確認してください。

0 投票する
1 に答える
326 参照

vb.net - エンコーディング 737 混乱

私はVB .Net 2008を使用しています

Encoding.Convertコマンドを使用して ASCII から 737 (ギリシャ語 DOS) に変換すると、読み取り可能な文字が返されるのに、 IO.StreamWriterwithを使用するEncoding.GetEncoding(737)と読み取り不能な文字を含むファイルが書き込まれるのはなぜですか?

ギリシャ語を 737 として印刷できるプリンターに行データを送信したいので、これを尋ねています。 の結果を送信するとEncoding.Covert、間違った結果が得られます。

0 投票する
2 に答える
1263 参照

c - ASCII 文字と非 ASCII 文字を含む文字列を反転します

この「abcd汉字efg」を含む文字列を逆にする方法について問題が発生しました。

復帰後は、次のようになります。

文字列を逆にするには、ASCII 以外の文字を特定する必要があると考えました。単純にすべてのバイトを逆にするだけでは正しい答えが得られないと思うからです。

どうすればいいですか?

PS: このプログラムは 32 ビットの Ubuntu で作成しました。次に、すべてのバイトを印刷しました:

「汉字」の代わりに意味不明なテキストが表示されました。

0 投票する
1 に答える
1694 参照

fonts - アクセント付きの文字は、貼り付けた後、奇妙に見えます(文字の後にアクセントが表示されます)

これが質問またはDoctypeに適した場所かどうかはわかりませんが、とにかく質問します...ドイツのクライアントと協力していて、この非常に奇妙な問題が発生し始めました。

そのため、Webサイトのコンテンツを入力しているときに、PDFシートからエディター(Espresso)にコピーして貼り付けます。奇妙なことは、すべてのテキストがエディター上で無垢に見える一方で、ブラウザーで開くと、アクセントのあるキャラクターのアクセントで奇妙な異常が発生し始め、前に押し出されることです。したがって、「Ö」はO"などとして表示されます。

ユニコードの問題だと思いましたが、サイトはutf8として宣言されており、リッチテキストなどは入力されておらず、エディターからの生のテキストです。ですから、それは本当に気が遠くなるようなことです。クライアントがファイルを直接編集する場合、ファイルは正しく表示されます。そして、アクセントのある文字を手動で入力して置き換えると、それも問題ないことがわかりました。

誰もが同様の経験/解決策を持っていましたか?

これらは本質的にラテン文字なので、ローカリゼーション/フォントの問題はないはずですが、私は持っているでしょうか?(私が間違っている場合は私を訂正してください)

0 投票する
1 に答える
130 参照

c++ - この文字がプログラムを停止させるのはなぜですか?

改行文字はc ++で何らかの特別な意味を持っていますか? 非ASCII文字ですか?

大きなテキスト内の一意の n 文字の部分文字列ごとにマルコフ連鎖を構築しようとしています。新しい一意の部分文字列に遭遇するたびに、その値が 256 要素のベクトル (拡張 ASCII テーブルの文字ごとに 1 つの要素) であるマップに入力します。

ファイルの内容全体を出力しても問題ありません (「行」は、ifstream と getline を使用して作成されたテキスト行のベクトルです)。

テキスト ファイル全体がコンソールに表示されます。この問題は、char を予期している関数に改行文字を返そうとすると発生します。「moveSpaces」は、反復ごとに文字列のベクトル内で何文字先に移動するかを決定する整数定数です。

私はデバッガーを使いこなしましたが、2 行目の 1 列目に到達すると、エラーも何も発生しませんでした。呼び出し関数ではなく、この関数内で失敗します。

私が使用しているファイルは A Christmas Carol (Project Gutenberg で最初に登場したもの) です。参考までに、最初の数行を次に示します。

関数は、2 行目の最初の文字を返す必要があるときに中断します。これは、改行を削除した場合、またはプログラム内で「行」ベクトルを自分で 1 行ずつ作成した場合には発生しません。何が問題なのですか?

0 投票する
1 に答える
1092 参照

c# - .Net MVC 2、ファイル名に非ASCII文字を含むファイルを返す

私は、任意の言語でエクスポートできる必要があるデータエクスポートタスクに取り組んでいます。厳密にASCII文字を使用するすべての言語は問題なく動作しますが、東洋の言語でデータをエクスポートすると、次の例外がスローされます。「メールヘッダーに無効な文字が見つかりました」少し調べて、これを判断しました。これは、「78文字より長い、または非ASCII文字を含むパラメーター値は[RFC2184]で指定されているようにエンコードする必要がある」と述べているRFC2183仕様によるものです。

私はこれらのドキュメントの両方を読みましたが、あまり役に立ちませんでした。ファイルを見つけるには、UTF-8エンコードでデータを送信する必要があることを理解しています。ただし、これにより、ダウンロードされたファイル名がエンコードされたUTF-8として表示されます。今のところ、以下に投稿する関数を使用して、ファイル名をUTFにエンコードしています。(これはすべてC#、MVC2にあります)

そして、ファイルは次の関数で返されます。

厳密に言えば、これは機能します。ただし、ユーザーに到達すると、ファイル名全体がUTFエンコードになります。その既存のファイルをユーザーに返して、ASCII以外の文字を保持できるようにする方法を探しています。

どんな助けでも大歓迎です。

0 投票する
1 に答える
662 参照

iphone - iPhoneでのASCII互換性についてキーボード入力を確認してください

ユーザーがキーボードをタップするとき、入力記号がASCIIパレットに属しているかどうかを知る必要があり、そうでない場合は削除します。

だから私がする必要があること

入力文字をチェックする方法は?

現在、ユーザーが(たとえば)ロシア語で入力すると、入力文字列からASCII文字を取得します。

0 投票する
2 に答える
1583 参照

windows - haskell:非ASCII文字を出力します

WinGHCiで非ASCII文字を出力したいのですが、これが私が得たものです:

私はWindowsXPでWinGHCi7.0.3を使用しています。WinGHCiが素敵な小さなデルタを印刷するにはどうすればよいですか?