問題タブ [python-unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
49396 参照

python - ロシア語の文字をファイルに書き込む方法は?

コンソールでロシア語の文字を出力しようとすると???????????????

誰が理由を知っていますか?

私はファイルに書き込もうとしました-この場合も同じ状況です。

例えば

ファイル内は-?????????????????????????/

また

追加のメモ帳では、ロシア語の文字でファイルを保存することを許可していません。私はこれを与えます:

このファイルには、このファイルをANSIエンコードされたテキストファイルとして保存すると失われるUnicode形式の文字が含まれています。Unicode情報を保持するには、下の[キャンセル]をクリックして、[エンコード]ドロップダウンリストからUnicodeオプションの1つを選択します。継続する?

システムを調整する方法。この問題は発生しません。

0 投票する
3 に答える
3552 参照

django - verbose_name または help_text にアクセント/特殊文字 (例: ñ) が含まれていますか?

verbose_name や help_text でアクセント記号や ñ などの特殊文字を含む文字を使用するにはどうすればよいですか?

0 投票する
6 に答える
15248 参照

url-encoding - pythonurlunquoteとそれに続くUnicodeデコード

のようなUnicode文字列が'%C3%A7%C3%B6asd+fjkls%25asd'あり、この文字列をデコードしたいと思います。
使用urllib.unquote_plus(str)しましたが、うまくいきません。

  • 期待される :çöasd+fjkls%asd
  • 結果 :çöasd fjkls%asd

二重にコード化されたutf-8文字(%C3%A7および%C3%B6)は誤ってデコードされます。
私のPythonバージョンはLinuxディストリビューションで2.7です。期待される結果を得る最良の方法は何ですか?

0 投票する
2 に答える
93 参照

python - Python Unicode 変換

Python で次の変換を行う方法は?

0 投票する
2 に答える
1491 参照

django-models - Djangoフォームのhelp_textのUnicode/特殊文字?

Model フィールドの に特殊文字 (具体的には ndash) を追加しようとしていますhelp_text。私はフォーム出力でそれを使用しているので、HTML で直感的に見えるものを試しました:

それから私は試しました:

まだ運がありません。考え?

0 投票する
5 に答える
23003 参照

python - Python2.7でのbase64エンコーディングUnicode文字列

requestsモジュールを使用してWebサービスから取得したUnicode文字列があります。この文字列には、バイナリドキュメント(PCL)のバイトが含まれています。これらのバイトの1つは値248であり、base64エンコードしようとすると、次のエラーが発生します。

248は符号なしバイトの範囲内にあるため(そしてバイト文字列に保持できるため)、これは少し驚くべきことですが、私の本当の質問は、この文字列をエンコードするための最良または正しい方法は何ですか?

私の現在の回避策はこれです:

これは正しくbyte_string機能しているようで、結果はbase64でエンコードできますが、もっと良い方法があるはずです。ある?

0 投票する
3 に答える
31093 参照

python - Pythonバイト文字列のエンコードとデコード

非ASCII文字を含む着信バイト文字列を有効なutf-8文字列に変換して、jsonとしてダンプできるようにしようとしています。

j は '\xc2\x80' であると予想していましたが、代わりに次のようになります。

私の状況では、「b」は Google プロトコル バッファ経由で mysql から送信され、いくつかの blob データが入力されています。

何か案は?

編集: mysql テーブルに blob として格納されているイーサネット フレームがあります (皆さん、話題にとどまり、テーブルにパケットがある理由について議論しないでください)。テーブル照合は utf-8 であり、db レイヤー (sqlalchemy、非 orm) はデータを取得し、ブロブを Python 'str' として格納する構造体 (Google プロトコル バッファー) を作成します。場合によっては、問題なくプロトコル バッファを直接使用します。それ以外の場合は、json を介して同じデータを公開する必要があります。私が気付いたのは、json.dumps() が機能するときに、「\x80」を無効な Unicode 文字 (\ufffd iirc) に置き換えることができることです。

0 投票する
7 に答える
318379 参照

python - Python-'ascii'コーデックはバイトをデコードできません

私は本当に混乱しています。エンコードしようとしましたが、エラーが表示されcan't decode...ました。

文字列に「u」プレフィックスが付いたエラーを回避する方法を知っています。encodeが呼び出されたときに、なぜエラーが「デコードできません」であるのか疑問に思っています。Pythonは内部で何をしていますか?

0 投票する
2 に答える
2026 参照

python - Pythonとlxmlでxmlのユニコードを無視しますか?

XML 内の Unicode を無視しようとしています。出力の処理でも何とか変更したいと思っています。

私のパイソン:

次の出力を作成します。

しかし、追加しようとすると、と の両方で次'-'join(target).replace('\n-','')のエラーが発生します。printoutFile.write

ユニコードを無視しtargetて、outFile.write?

0 投票する
1 に答える
3029 参照

python - タミル語のユニコード値の配列を、空白を含むPythonでタミル語の文字列に変換するにはどうすればよいですか?

タミル語のUnicodeコードポイントのリストは次のとおりです

[u'\ u0b9a'、u'\ u0b9f'、u'\ u0bcd'、u'\ u0b9f'、u'\ u0b9a'、u'\ u0baa'、u'\ u0bc8'、u'\ u0baf'、u '\ u0bbf'、u'\ u0bb2'、u'\ u0bcd'、u'\ u0ba8'、u'\ u0bc7'、u'\ u0bb1'、u'\ u0bcd'、u'\ u0bb1'、u'\ u0bc1]

どうすれば読み取り可能な文字列に変換できますか?