3
4

2 に答える 2

3

xml.parsers.expat.ParserCreate4 つのエンコーディングしかサポートしていないので、すべて試してみます。これらのエンコーディングは UTF-8、 、UTF-16ISO-8859-1( Latin1) 、およびASCII.

ElementTree.parse次のようなエンコーディングで実行できるようになりました。

from xml.etree.ElementTree import ElementTree
from xml.parsers import expat
tree = ElementTree()
root = tree.parse(xml_file, parser=expat.ParserCreate('UTF-8') )
root = tree.parse(xml_file, parser=expat.ParserCreate('UTF-16') )
root = tree.parse(xml_file, parser=expat.ParserCreate('ISO-8859-1') )
root = tree.parse(xml_file, parser=expat.ParserCreate('ASCII') )
于 2012-07-02T07:56:37.533 に答える
1

確立する必要があるものが2つあります。

(a)XML宣言はありますか?それはエンコーディングについて何と言っていますか?

(b)これらの文字を表すために使用されるファイル内の実際のバイトは何ですか?

于 2012-07-02T09:06:38.147 に答える