python - Python 2.7 Unicode/IDLE の混乱

Question

私は Unicode と Python 2.7 のさまざまなエンコーディング/デコーディングについて多くのことを読みましたが、IDLE が正しい文字列を出力できないように見える理由を理解するのにまだ苦労しています。

私はユニコード文字列を持っています:

>>> s = u"Hey I\u2019m Bob"
>>> print s
Hey I'm Bob

ただし、UTF-8 にエンコードすると、次のようになります。

>>> s.encode('utf-8')
'Hey I\xe2\x80\x99m Bob'
>>> print s.encode('utf-8')
Hey Iâ€™m Bob

これを正しく印刷できない理由はわかりませんが、 s.encode('utf-8') をテキストファイルに書き込めば、正しく出力されます。これがIDLEと関係があるかどうかわかりませんか?

score 1 · Accepted Answer

これは、IDLE の出力ウィンドウが UTF-8 をサポートしていないためですが、Unicode 文字列を出力すると、標準出力エンコーディングで文字列を自動的にエンコードしようとします。以下は、IDLE コンソールからのものです。

>>> s = u"Hey I\u2019m Bob"
>>> print s
Hey I’m Bob
>>> print s.encode('utf8')
Hey Iâ€™m Bob
>>> import sys
>>> sys.stdout.encoding
'cp1252'
>>> print s.encode('cp1252')
Hey I’m Bob

python - Python 2.7 Unicode/IDLE の混乱

1 に答える 1

Related

Reference