python - 奇妙な Xml ファイルをデコードできません

Question

以下のように、(リクエストから Web サイトへの) xml 出力を解析する必要があります。一部英語、一部フランス語です。「é」や「à」などのフランス語のアクセントをデコードして (画面上、ファイル上に) 印刷することができません。

を使用するdecode('utf-8')と、' ' のような間違った結果が得られÃ¨ます。私はpython 3.3を使用しています。

b'Extr\xc3\x83\xc2\xaamement fort et incroyablement pr\xc3\x83\xc2\xa8s</title><originaltitle>Extremely Loud And Incredibly Close</originaltitle><year>2011</year><runtime>0</runtime><directors><director>Stephen Daldry</director></directors><plot>Oskar Schell, 11 ans, est un jeune New-Yorkais \xc3\x83\xc2\xa0 l\'imagination d\xc3\x83\xc2\xa9bordante. Un an apr\xc3\x83\xc2\xa8s la...</plot></movie></results>\n'

score 5 · Accepted Answer

貼り付けたバイト文字列は二重にエンコードされており、

byteStrInYourQuestion.decode('utf-8').encode("ISO-8859-1").decode("utf-8")

動作するはずです。

python - 奇妙な Xml ファイルをデコードできません

1 に答える 1

Related

Reference