python - Unicode文字列をバイト文字列に変換します

Question

のように表される関数から文字列を取得しますがu'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'、それを処理するには、（のように'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'）バイト文字列である必要があります。

変更せずに変換するにはどうすればよいですか？

これまでの私の最善の推測は、「\xd0」が「\xd0」として表される1文字になるように、5文字ごとs.encode('unicode_escape')に返され、処理される、を取ることです。'\\xd0\\xbc\\xd0\\xb0\\xd1\\x80\\xd0\\xba\\xd0\\xb0'

score 23 · Accepted Answer

ISO 8859-1（別名Latin-1）は、最初の256個のUnicodeコードポイントをそれらのバイト値にマップします。

>>> u'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'.encode('latin-1')
'\xd0\xbc\xd0\xb0\xd1\x80\xd0\xba\xd0\xb0'

python - Unicode文字列をバイト文字列に変換します

1 に答える 1

Related

Reference