Python のビルトイン XML パーサーを使用して 1.5 ギガの XML ファイルをロードすると、1 日かかります。
from xml.dom import minidom
xmldoc = minidom.parse('events.xml')
進行状況バーを表示できるように、その内部に入り、進行状況を測定する方法を知る必要があります。何か案は?
minidom には parseString() という別のメソッドがあり、渡す文字列が有効な XML であると仮定して DOM ツリーを返します。ファイルを自分でチャンクに分割し、一度に parseString に 1 つずつ渡すとしたら、すべての最後に DOM ツリーを元に戻す?