Pythonスクリプトをpython 3からpython2に書き直す必要があり、その後、ElementTreeで特殊文字を解析する際に問題が発生しました。
これは私のxmlの一部です:
<account number="89890000" type="Kostnad" taxCode="597" vatCode="">Avsättning egenavgifter</account>
これは、この行を解析したときの出力です。
('account:', '89890000', 'AccountType:', 'Kostnad', 'Name:', 'Avs\xc3\xa4ttning egenavgifter')
ということで、「あ」という文字に問題がありそうです。
これは私がコードでそれを行う方法です:
sys.setdefaultencoding( "UTF-8" )
xmltree = ET()
xmltree.parse("xxxx.xml")
printAccountPlan(xmltree)
def printAccountPlan(xmltree):
print("account:",str(i.attrib['number']), "AccountType:",str(i.attrib['type']),"Name:",str(i.text))
ElementTree で文字 "ä" を解析するアイデアは誰にでもあるので、結果は次のようになります。
('account:', '89890000', 'AccountType:', 'Kostnad', 'Name:', 'Avsättning egenavgifter')