python - 辞書に挿入した後のPython文字列「変換」

Question

英語以外のテキストを辞書に追加すると、「\xe0\xa6\xb9\xe0\xa6\xb0\xe0\xa6\x」のようなテキストが生成されます。

Example:
obj = {}
title = 'non english text'
print "title ...",title
obj['title'] = title
print obj

その戻り：

    title... non english text
   {'title': '\xe0\xa6\xb9\xe0\xa6\'}

任意のアイデア、どうすれば修正できますか?

前もって感謝します。

score 3 · Accepted Answer

UTF-8 でエンコードされたデータを見ています。

>>> '\xe0\xa6\xb9\xe0\xa6\xb0'.decode('utf8')
u'\u09b9\u09b0'
>>> print '\xe0\xa6\xb9\xe0\xa6\xb0'.decode('utf8')
হর

それを Unicode テキストにデコードするには、を使用します.decode('utf8')。その文字列を端末に直接出力し、端末が UTF-8 を処理するように構成されている場合、それらの文字はデコードされて表示されますが、dict表現は含まれているデータの python リテラル表現を示しています。

Python Unicode HOWTOとThe Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)をお読みください。

score 0 · Accepted Answer

これはUnicode処理エラーです。Python 3では、すべてtextがunicode-試してみてください。ASCII以外の文字セットでの例が機能するはずであり、頭痛の種を減らすことができます。

Python 2.xに固執している場合は、Martijnが言っていることに注意してください。

python - 辞書に挿入した後のPython文字列「変換」

2 に答える 2

Related

Reference