0

次の内容のプレーン テキスト ファイルがあります。

Test: \u0410\u0412\u0422\u041e

そのファイルを python で読み込んで、次のように文字を Unicode で出力しようとしました。

import codecs
f = codecs.open('b.txt', encoding='utf-8')
for line in f:
    print line

出力:

Test: \u0410\u0412\u0422\u041e

私はこのテキストを期待していました:

Test: ABTO

キリル文字の STOP に続く「テスト」。

4

1 に答える 1

2

Unicode エスケープ シーケンスを含む ASCII ファイルがあります。次のようにデコード関数を適用できるように、フォーム\u0410...に変換する必要があります。\\u0410....

f = open('b','r')
for line in f:
    line.replace('\u','\\u')
    print line.decode('unicode-escape')
于 2012-08-29T15:31:35.797 に答える