問題タブ [python-unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Unicode 例外を理解しようとしています
指定されていない型の文字列オブジェクトがあります。これは types.StringTypes に一致しますが、type.StringType または type.UnicodeType の可能性があります - 何を受け取るかわかりません。入ってくるものを必ずしも制御することはできません。
私の問題は、文字列型にASCII以外の文字があり、呼び出しをミサカ(日没パーサー)に渡すと発生します
この例では、 unichr(8250) / u'\u203a' を扱っているため、エラー ログで数回発生しました...
「a」オブジェクトをミサカが問題にならないものに変える方法がわかりません。'b' は常に機能します。誰でも提案できますか?
python - Unicode から Python の元の文字へ
たとえば、
次に、次の出力が得られます。'Austro-Hungarian_gulden'
しかし、私は以下のようなデータセットを含むtxtファイルを使用しています:
そして、このデータをPythonで正規表現を使用して処理する必要があるため、以下のようなスクリプトを作成しましたが、文字列内のUnicode値を適切な文字に置き換えることはできません。
同じく
テキストファイルを処理するためのスクリプト:
指定されたデータの期待される出力は次のとおりです。
どうすればいいですか?
python - unicode の元の python 型を変換する方法
郵便配達員の残りのクライアントを使用して、このようなデータを投稿しています。
データをユニコードとして取得しているため、このタイプのデータから辞書の値を取得できませんでした。
私がしていること
辞書項目にアクセスできるように、ユニコードをリストと辞書のリスト項目に変換する方法。
私はdjango restフレームワークを使用していることに注意してください。
python - Python の unicode 関数によって認識される、サポートされているすべてのエンコーディングを確認するにはどうすればよいですか?
Python にはunicode
、バイト ストリームを Unicode 文字列に変換する組み込み関数があります。
システムで利用可能なすべてのエンコーディングを照会できることを願っています。しかし、どのように。
この質問の理由は次のとおりです。MAC OS X を使用している人が、コンテンツ エンコーディング 'iso-2022-cn' を含む電子メールを私に送信しました。Windows 7 上の Python 2.7 がそのエンコーディングを認識しないことがわかりました。
そこで、Python がサポートできるすべてのエンコーディングを調べて、「iso-2022-cn」に別の名前を使用しているかどうかを調べたいと思います。
python - Python は Unicode 文字を含むファイルを保存しません
Python はファイルをヘブライ文字で保存しません。これを修正するにはどうすればよいですか? (パイソン2.7)
サンプル イメージは、SPE IDE 内のファイルの最初の行を示しています。
python - 文字列を正しい文字セットに変換する
Unicode データを外部 Web サービスに保存しようとしています。
を保存しようとすると、外部システムにæ-ø-å
保存されます。æ-ø-Ã¥
編集:
(私の名の値はJørn
) (django からの値J\\xf8rn
)
firstname.value=user_firstname
=Jørn
エンコードを使用しようとした場合の結果は次のとおりです。
firstname.value=user_firstname.encode('ascii', 'replace')
=J?rn
firstname.value=user_firstname.encode('ascii', 'xmlcharrefreplace')
=Jørn
firstname.value=user_firstname.encode('ascii', 'backslashreplace')
=J\xf8rn
firstname.value=user_firstname.encode('ascii', 'ignore')
= ignore を使用すると Unicode エラーが発生します。
ユーザーを更新するための私のフォーム:
これが私の仕事です:
データを正しく保存するにはどうすればよいですか?