私のコード:
a = '汉'
b = u'汉'
この二つは同じ漢字です。しかし、明らかに、a == b
ですFalse
。これを修正するにはどうすればよいですか? コードにアクセスできないため、にa
変換できないことに注意してください。使用しているエンコーディングutf-8
に変換する必要があります。b
a
b
それで、私の質問は、 のエンコーディングを のエンコーディングに変えるにはどうすればよいa
ですか?
a
を使用してエンコードされた文字列をデコードしますstr.decode
。
>>> a = '汉'
>>> b = u'汉'
>>> a.decode('utf-8') == b
True
注意utf-8
ソースコードのエンコーディングに合わせて置き換えてください。