utf-8として解釈されるべきでしたが、そうではなかったテキストを含むテキストファイルがあります(この方法で渡されました)。ファイルの一般的な行の例を次に示します。
\ u30ed \ u30f3 \ u30c9 \ u30f3 \ u5728 \ u4f4f
すべきだった:
ロンドン
これで、コマンドラインに次のように入力することで、Pythonで手動で実行できます。
>>> h1 = u'\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f'
>>> print h1
ロンドン在住
それは私が欲しいものを私に与えます。これを自動的に行う方法はありますか?私はこのようなことをやってみました
>>> f = codecs.open('testfile.txt', encoding='utf-8')
>>> h = f.next()
>>> print h
\u30ed\u30f3\u30c9\u30f3\u5728\u4f4f
'encode'および'decode'関数も試してみましたが、何かアイデアはありますか?
ありがとう!