私は文字列を持っています:
\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e
Pythonを使用してUnicodeに変更したい
それ、どうやったら出来るの?
それは既に UTF-8 データです。python は文字列リテラル形式を表示しています。
>>> print '\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e'.decode('utf8')
דלית
上記の行は、UTF-8 データをprint unicode` オブジェクトを持つunicode
オブジェクトにデコードして、端末が正しく表示できるようにします。.decode('utf8') and prints that; the
statement inspects the encoding used by my terminal and re-encodes the
Python と Unicode について読みたいと思うかもしれません:
Python Unicode HOWTO
Ned Batchelder による実用的な Unicode
すべてのソフトウェア開発者が絶対に、積極的に Unicode と文字セットについて知っておく必要がある絶対的な最小値 (言い訳はありません!) by Joel Spolsky