問題タブ [python-unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ロシア語の文字をファイルに書き込む方法は?
コンソールでロシア語の文字を出力しようとすると???????????????
誰が理由を知っていますか?
私はファイルに書き込もうとしました-この場合も同じ状況です。
例えば
ファイル内は-?????????????????????????/
また
追加のメモ帳では、ロシア語の文字でファイルを保存することを許可していません。私はこれを与えます:
このファイルには、このファイルをANSIエンコードされたテキストファイルとして保存すると失われるUnicode形式の文字が含まれています。Unicode情報を保持するには、下の[キャンセル]をクリックして、[エンコード]ドロップダウンリストからUnicodeオプションの1つを選択します。継続する?
システムを調整する方法。この問題は発生しません。
django - verbose_name または help_text にアクセント/特殊文字 (例: ñ) が含まれていますか?
verbose_name や help_text でアクセント記号や ñ などの特殊文字を含む文字を使用するにはどうすればよいですか?
url-encoding - pythonurlunquoteとそれに続くUnicodeデコード
のようなUnicode文字列が'%C3%A7%C3%B6asd+fjkls%25asd'
あり、この文字列をデコードしたいと思います。
使用urllib.unquote_plus(str)
しましたが、うまくいきません。
- 期待される :
çöasd+fjkls%asd
- 結果 :
çöasd fjkls%asd
二重にコード化されたutf-8文字(%C3%A7
および%C3%B6
)は誤ってデコードされます。
私のPythonバージョンはLinuxディストリビューションで2.7です。期待される結果を得る最良の方法は何ですか?
python - Python Unicode 変換
Python で次の変換を行う方法は?
django-models - Djangoフォームのhelp_textのUnicode/特殊文字?
Model フィールドの に特殊文字 (具体的には ndash) を追加しようとしていますhelp_text
。私はフォーム出力でそれを使用しているので、HTML で直感的に見えるものを試しました:
それから私は試しました:
まだ運がありません。考え?
python - Python2.7でのbase64エンコーディングUnicode文字列
requests
モジュールを使用してWebサービスから取得したUnicode文字列があります。この文字列には、バイナリドキュメント(PCL)のバイトが含まれています。これらのバイトの1つは値248であり、base64エンコードしようとすると、次のエラーが発生します。
248は符号なしバイトの範囲内にあるため(そしてバイト文字列に保持できるため)、これは少し驚くべきことですが、私の本当の質問は、この文字列をエンコードするための最良または正しい方法は何ですか?
私の現在の回避策はこれです:
これは正しくbyte_string
機能しているようで、結果はbase64でエンコードできますが、もっと良い方法があるはずです。ある?
python - Pythonバイト文字列のエンコードとデコード
非ASCII文字を含む着信バイト文字列を有効なutf-8文字列に変換して、jsonとしてダンプできるようにしようとしています。
j は '\xc2\x80' であると予想していましたが、代わりに次のようになります。
私の状況では、「b」は Google プロトコル バッファ経由で mysql から送信され、いくつかの blob データが入力されています。
何か案は?
編集: mysql テーブルに blob として格納されているイーサネット フレームがあります (皆さん、話題にとどまり、テーブルにパケットがある理由について議論しないでください)。テーブル照合は utf-8 であり、db レイヤー (sqlalchemy、非 orm) はデータを取得し、ブロブを Python 'str' として格納する構造体 (Google プロトコル バッファー) を作成します。場合によっては、問題なくプロトコル バッファを直接使用します。それ以外の場合は、json を介して同じデータを公開する必要があります。私が気付いたのは、json.dumps() が機能するときに、「\x80」を無効な Unicode 文字 (\ufffd iirc) に置き換えることができることです。
python - Python-'ascii'コーデックはバイトをデコードできません
私は本当に混乱しています。エンコードしようとしましたが、エラーが表示されcan't decode...
ました。
文字列に「u」プレフィックスが付いたエラーを回避する方法を知っています。encodeが呼び出されたときに、なぜエラーが「デコードできません」であるのか疑問に思っています。Pythonは内部で何をしていますか?
python - Pythonとlxmlでxmlのユニコードを無視しますか?
XML 内の Unicode を無視しようとしています。出力の処理でも何とか変更したいと思っています。
私のパイソン:
次の出力を作成します。
しかし、追加しようとすると、と の両方で次'-'join(target).replace('\n-','')
のエラーが発生します。print
outFile.write
ユニコードを無視しtarget
て、outFile.write
?
python - タミル語のユニコード値の配列を、空白を含むPythonでタミル語の文字列に変換するにはどうすればよいですか?
タミル語のUnicodeコードポイントのリストは次のとおりです
[u'\ u0b9a'、u'\ u0b9f'、u'\ u0bcd'、u'\ u0b9f'、u'\ u0b9a'、u'\ u0baa'、u'\ u0bc8'、u'\ u0baf'、u '\ u0bbf'、u'\ u0bb2'、u'\ u0bcd'、u'\ u0ba8'、u'\ u0bc7'、u'\ u0bb1'、u'\ u0bcd'、u'\ u0bb1'、u'\ u0bc1]
どうすれば読み取り可能な文字列に変換できますか?