3

私はこのような文字列を持っています。

st = '/M\xe4rzen'

これをUnicodeに変換したいと思います。これどうやってするの?私はもう試した:

st.decode('utf-8')
unicode(t, 'utf-8')

元のファイルはutf-8でエンコードされていますが、文字列のUnicode表現を取得できないようです。

4

1 に答える 1

11

データはUTF8でエンコードされていません。Latin-1エンコーディングを使用している可能性が高いです。

>>> print st.decode('latin1')
/Märzen

呼び出すだけで十分です。また呼び出す.decode()必要はありません。unicode()

于 2013-03-26T12:47:25.460 に答える