5
4

1 に答える 1

7

取得する出力は正しいです。これは、日本語の文字列のUTF-8表現です。問題は、コンソール自体がUTF-8を理解していないことです。その文字列をファイルに書き込み、UTF-8を理解するエディターで開くと、期待どおりのコンテンツが表示されます。コンソールのエンコーディングをUTF-8に変更することもできます。

編集:あなたはまた、一緒に何かを試すことができます:

print '7\xe6\x9c\x8810\xe6\x97\xa5'.decode('utf-8')

ただし、これが機能するかどうかは、コンソールエンコーディングが日本語の文字をサポートしているかどうかによって異なります。たとえば、コンソールのエンコーディングが「ISO Latin-1」の場合、機能しません...

読むことをお勧めします:http://www.joelonsoftware.com/articles/Unicode.html

于 2012-07-10T08:44:32.880 に答える