問題タブ [non-ascii-characters]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
8582 参照

c# - C#の直角文字を除くすべての非ASCII文字を置き換える

ファイルからすべての非ASCII文字を取り除くファイルユーティリティを作成します。私はこの正規表現を持っています:

これは問題なく動作します。しかし、残念ながら、一部の愚かな人々がファイルの区切り文字として直角(¬)を使用していることを発見したので、これらも削除されますが、私はそれらが必要です!

私は正規表現にかなり慣れていません。基本は理解していますが、どんな助けでも素晴らしいでしょう!

前もって感謝します!

0 投票する
2 に答える
1373 参照

perl - Perl のファイルから非 ASCII 文字を含む行を削除する

12,0006時間生成される約行のファイルがあります。これらの行のいくつかには、ASCII 以外の文字があります。

Perl スクリプトを実行して、非 ASCII 文字を含むすべての行を削除できるようにしたいと考えています。

0 投票する
2 に答える
3908 参照

file - 非ASCII文字を見つけるためのUnixコマンド

サイズが500MBのファイルがあります。ASCII 以外の文字が含まれています。Unixコマンドを使用してそれらの文字を見つけたいだけです。行番号と各行の位置を取得する方が良いかもしれません。

ありがとう :)

0 投票する
10 に答える
33182 参照

python - urlopenで非ASCIIURLをフェッチする方法は?

非ASCII文字を含むURLからデータをフェッチする必要がありますが、urllib2.urlopenはリソースを開くことを拒否し、次のように表示します。

URLが標準に準拠していないことは知っていますが、変更する機会はありません。

Pythonを使用して非ASCII文字を含むURLが指すリソースにアクセスする方法は何ですか?

編集:言い換えると、urlopenは次のようなURLを開くことができます/どのように開くか:

0 投票する
1 に答える
390 参照

django - Django とローカリゼーションが、アクセント付きの文字を含む文字列を認識しない

django を使用して、一部の文字列をイタリア語から他の言語にローカライズしようとしています。すべてが正常に機能していますが、アクセント付きの文字を含む文字列では機能していません。

元のファイルは、翻訳された .po ファイルと同様に UTF-8 で保存されます。文字列は同一で、compilemessages コマンドは警告なしで機能します。ただし、ページを開こうとすると、それらの文字列の翻訳バージョンが表示されず、それらのみが表示されます。

何を確認すればよいですか?

ありがとう!

0 投票する
2 に答える
4497 参照

python - Google App Engine での Python の Unicode

データが非 ASCII (中国語、日本語の文字) である可能性がある POST 要求を行う必要があります。入力を Unicode に変換し、utf-8 でエンコードする必要があります。これが私がそれをした方法です:

ただし、ログに次のエラーが表示され続けます。

TypeError: Unicode のデコードはサポートされていません

0 投票する
2 に答える
973 参照

c# - linq to XML を使用した XML ファイルでの非 ASCII 文字検索の問題

次のlinq to xmlクエリを使用して、XMLファイル内の要素を検索しています

そして、私のxmlファイルは

is equal to "Åker"にもかかわらずRequest.QueryString("DbName")、クエリは結果を返しません。

0 投票する
3 に答える
16603 参照

python - \xXY でエンコードされた文字を Python で UTF-8 に変換するには?

「\xaf」、「\xbe」などの文字を含むテキストがあります。これは、この質問から理解できるように、ASCII エンコードされた文字です。

Python でそれらを UTF-8 に相当するものに変換したいと考えています。いつものstring.encode("utf-8")スローUnicodeDecodeError。たとえば、codecs標準ライブラリを使用するなど、より良い方法はありますか?

200 文字のサンプルはこちら.

0 投票する
5 に答える
7760 参照

regex - grep/regex はアクセント付きの単語を見つけることができません

この単語のすべての文字が単語パターンと一致するファイルにいくつかの単語を取得する正規表現をマウントしようとしています。

私の問題は、正規表現がアクセント付きの単語を見つけることができないことですが、私のテキスト ファイルにはアクセント付きの単語がたくさんあります。

私のコマンドラインは次のとおりです。

ファイルの内容は次のとおりです。

どうすれば修正できますか?

0 投票する
2 に答える
1159 参照

python - Google 検索 API を呼び出そうとしている Unicode エラー

クエリの結果の数を取得するには、Google 検索を実行する必要があります。ここで答えを見つけました-PythonアプリからのGoogle検索

ただし、いくつかのクエリでは、以下のエラーが発生します。クエリにユニコード文字が含まれていると思います。

UnicodeDecodeError: 'ascii' コーデックは位置 28 のバイト 0xc3 をデコードできません: 序数が範囲外です (128)

Google を検索したところ、Unicode を ascii に変換する必要があることがわかり、以下のコードが見つかりました。

アクションを無視すると、それらの文字が削除されますが、他のアクションを使用すると、例外が発生します。

これを処理する方法はありますか?

ありがとう

== 編集 == 以下のコードを使用してエンコードしてから検索を実行すると、エラーがスローされます。

クエリ = urllib.urlencode({'q': searchfor})