問題タブ [python-unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
203 参照

python - Python Unicode 例外を理解しようとしています

指定されていない型の文字列オブジェクトがあります。これは types.StringTypes に一致しますが、type.StringType または type.UnicodeType の可能性があります - 何を受け取るかわかりません。入ってくるものを必ずしも制御することはできません。

私の問題は、文字列型にASCII以外の文字があり、呼び出しをミサカ(日没パーサー)に渡すと発生します

この例では、 unichr(8250) / u'\u203a' を扱っているため、エラー ログで数回発生しました...

「a」オブジェクトをミサカが問題にならないものに変える方法がわかりません。'b' は常に機能します。誰でも提案できますか?

0 投票する
1 に答える
765 参照

python - Unicode から Python の元の文字へ

たとえば、

次に、次の出力が得られます。'Austro-Hungarian_gulden'

しかし、私は以下のようなデータセットを含むtxtファイルを使用しています:

そして、このデータをPythonで正規表現を使用して処理する必要があるため、以下のようなスクリプトを作成しましたが、文字列内のUnicode値を適切な文字に置き換えることはできません。

同じく

テキストファイルを処理するためのスクリプト:

指定されたデータの期待される出力は次のとおりです。

どうすればいいですか?

0 投票する
1 に答える
418 参照

python - unicode の元の python 型を変換する方法

郵便配達員の残りのクライアントを使用して、このようなデータを投稿しています。

データをユニコードとして取得しているため、このタイプのデータから辞書の値を取得できませんでした。

私がしていること

辞書項目にアクセスできるように、ユニコードをリストと辞書のリスト項目に変換する方法。

私はdjango restフレームワークを使用していることに注意してください。

0 投票する
1 に答える
1381 参照

python - Python の unicode 関数によって認識される、サポートされているすべてのエンコーディングを確認するにはどうすればよいですか?

Python にはunicode、バイト ストリームを Unicode 文字列に変換する組み込み関数があります。

ここに画像の説明を入力

システムで利用可能なすべてのエンコーディングを照会できることを願っています。しかし、どのように。

この質問の理由は次のとおりです。MAC OS X を使用している人が、コンテンツ エンコーディング 'iso-2022-cn' を含む電子メールを私に送信しました。Windows 7 上の Python 2.7 がそのエンコーディングを認識しないことがわかりました。

そこで、Python がサポートできるすべてのエンコーディングを調べて、「iso-2022-cn」に別の名前を使用しているかどうかを調べたいと思います。

0 投票する
3 に答える
282 参照

python - Python は Unicode 文字を含むファイルを保存しません

Python はファイルをヘブライ文字で保存しません。これを修正するにはどうすればよいですか? (パイソン2.7)

ここに画像の説明を入力

サンプル イメージは、SPE IDE 内のファイルの最初の行を示しています。

0 投票する
2 に答える
2233 参照

python - 文字列を正しい文字セットに変換する

Unicode データを外部 Web サービスに保存しようとしています。

を保存しようとすると、外部システムにæ-ø-å保存されます。æ-ø-Ã¥

編集:

(私の名の値はJørn) (django からの値J\\xf8rn)

firstname.value=user_firstname=Jørn

エンコードを使用しようとした場合の結果は次のとおりです。

firstname.value=user_firstname.encode('ascii', 'replace')=J?rn

firstname.value=user_firstname.encode('ascii', 'xmlcharrefreplace')=Jørn

firstname.value=user_firstname.encode('ascii', 'backslashreplace')=J\xf8rn

firstname.value=user_firstname.encode('ascii', 'ignore')= ignore を使用すると Unicode エラーが発生します。

ユーザーを更新するための私のフォーム:

これが私の仕事です:

データを正しく保存するにはどうすればよいですか?