Unicode 文字列を含むファイルがあります。u"L'\xe9quipe le quotidien"
Windowsからエクスポートされiso-8859-1
、同じ文字列でエンコードされた別のファイルがあります:(これは私のシェル"L'<E9>quipe le quotidien"
からのコピー/貼り付けです)。less
Windows ファイルの内容を で変換すると、Windows ファイルの内容とdecode('iso-8859-1').encode('utf8')
は異なる文字列になります: L'équipe le quotidien
.
この比較を行う最良の方法は何ですか? latin1 文字列を utf-8 に変換できないようです。