私のコード:
a = '汉'
b = u'汉'
この二つは同じ漢字です。しかし、明らかに、a == bですFalse。これを修正するにはどうすればよいですか? コードにアクセスできないため、にa変換できないことに注意してください。使用しているエンコーディングutf-8に変換する必要があります。ba
bそれで、私の質問は、 のエンコーディングを のエンコーディングに変えるにはどうすればよいaですか?
aを使用してエンコードされた文字列をデコードしますstr.decode。
>>> a = '汉'
>>> b = u'汉'
>>> a.decode('utf-8') == b
True
注意utf-8ソースコードのエンコーディングに合わせて置き換えてください。