0

以下のように、(リクエストから Web サイトへの) xml 出力を解析する必要があります。一部英語、一部フランス語です。「é」や「à」などのフランス語のアクセントをデコードして (画面上、ファイル上に) 印刷することができません。

を使用するdecode('utf-8')と、' ' のような間違った結果が得られèます。私はpython 3.3を使用しています。

b'Extr\xc3\x83\xc2\xaamement fort et incroyablement pr\xc3\x83\xc2\xa8s</title><originaltitle>Extremely Loud And Incredibly Close</originaltitle><year>2011</year><runtime>0</runtime><directors><director>Stephen Daldry</director></directors><plot>Oskar Schell, 11 ans, est un jeune New-Yorkais \xc3\x83\xc2\xa0 l\'imagination d\xc3\x83\xc2\xa9bordante. Un an apr\xc3\x83\xc2\xa8s la...</plot></movie></results>\n'
4

1 に答える 1

5

貼り付けたバイト文字列は二重にエンコードされており、

byteStrInYourQuestion.decode('utf-8').encode("ISO-8859-1").decode("utf-8")

動作するはずです。

于 2013-01-06T17:10:46.653 に答える