Python2.7を使用しています
「iso-8859-1」でコード化された情報を含むファイルを読んでいます。解析後、結果を文字列で取得します。つまり、次のようになりますs1
。
>>> s1
'D\xf6rfli'
>>> type(s1)
<type 'str'>
>>> s2=s1.decode("iso-8859-1").encode("utf8")
>>> s2
'D\xc3\xb6rfli'
>>> type(s2)
<type 'str'>
>>> print s1, s2
D�rfli Dörfli
>>>
呼び出し後のタイプがs2
まだaであるのはなぜですか?どうすればからに変換できますか?str
.encode
str
utf-8