lxmlを使用してXMLファイル(UTF-8でエンコードされ、で始まる)を反復処理しようとしていますが、文字丂で次のエラーが発生します。
UnicodeEncodeError:'cp932'コーデックは位置0の文字u'\ u4e02'をエンコードできません:不正なマルチバイトシーケンス
この前の他の文字は正しく印刷されます。コードは次のとおりです。
parser = etree.XMLParser(encoding='utf-8')
tree = etree.parse("filename.xml", parser)
root = tree.getroot()
for elem in root:
print elem[0].text
エラーは、ファイルをutf-8で解析せず、代わりにシフトJISで解析したことを意味しますか?