HTMLの一部であるテキストがあります。ファイルに保存したいと思います。
これは Eclipse のデバッグ モードでは問題なく動作しますが、シェルからの実行時には失敗します。失敗する html の短い例を使用しています。
xx = '<input type="hidden" name="charset_test" value="€,´,€,´,水,Д,Є" />'
with codecs.open('myfile.htm'), 'wb', encoding="utf-8") as output:
output.write(data)
そして私は得る:
Exception 'ascii' codec can't decode byte 0xe2 in position XXX: ordinal not in range(128)
ここで、XXX は、ユーロ記号などの「奇妙な」記号の関連ファイル内の位置です。
これがシェルではなく Eclipse で機能するのはなぜですか? これを解決するにはどうすればよいですか?
私は試した
HTMLParser.HTMLParser().unescape()
unquote()
unicode()
何も機能しませんでした...