私はこの形式の大きなxmlファイル(約84MB)を持っています:
<books>
<book>...</book>
....
<book>...</book>
</books>
私の目標は、すべての本を抽出してそのプロパティを取得することです。私はそれを(他のxmlファイルで行ったように)次のように解析しようとしました:
from xml.dom.minidom import parse, parseString
fd = "myfile.xml"
parser = parse(fd)
## other python code here
しかし、コードは解析命令で失敗するようです。なぜこれが起こっているのですか、どうすればこれを解決できますか?
ファイルにはギリシャ語、スペイン語、アラビア語の文字が含まれている可能性があることを指摘しておく必要があります。
これは私がipythonで得た出力です:
In [2]: fd = "myfile.xml"
In [3]: parser = parse(fd)
Killed
実行中にコンピュータがフリーズすることを指摘したいので、これは以下のようにメモリ消費に関係している可能性があります。