0

HTMLの一部であるテキストがあります。ファイルに保存したいと思います。

これは Eclipse のデバッグ モードでは問題なく動作しますが、シェルからの実行時には失敗します。失敗する html の短い例を使用しています。

xx = '<input type="hidden" name="charset_test" value="€,´,€,´,水,Д,Є" />'
with codecs.open('myfile.htm'), 'wb', encoding="utf-8") as output:
    output.write(data)

そして私は得る:

 Exception 'ascii' codec can't decode byte 0xe2 in position XXX: ordinal not in range(128)

ここで、XXX は、ユーロ記号などの「奇妙な」記号の関連ファイル内の位置です。

これがシェルではなく Eclipse で機能するのはなぜですか? これを解決するにはどうすればよいですか?

私は試した

HTMLParser.HTMLParser().unescape()
unquote()
unicode()

何も機能しませんでした...

4

1 に答える 1