-2

Unicode コーデックを持つように minidom インスタンスを構成するにはどうすればよいですか?

XML ファイルでこのスニペットを処理する:

<title type="text">ME850单片机开发实验仪(增强配置)(产品浏览)-伟纳电子-http://www.willar.com/</title>

このエラーが発生します:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-12: ordinal not in range(128)

更新: Python 3 で期待どおりに動作します。どうやらこれは 2.x の既知の制限です。

4

2 に答える 2

4

Python 2.xでは、minidomはバイト文字列のみを解析できます。そもそもドキュメントをデコードしないか(ヒント:より具体的な提案では、実行しているコードが必要になります)、またはUTF-8にエンコードします。

または、Python 3.xに切り替えることもできます。この場合、minidomはバイトと文字列を処理できます。

于 2012-08-06T19:50:28.017 に答える
0

あなたが使用することができます:

str.encode('utf-8')
于 2013-07-11T12:25:42.333 に答える