私は次のコードセグメントを持っています
import xml.etree.cElementTree as et
fstring = open(filename).read()
tree = et.fromstring(fstring)
for el in tree.findall('tag'):
do stuff
ただし、fstringは巨大(〜80mbsのデータ)であり、文字列をツリーに変換しようとすると、「メモリ不足」エラーが発生します。それを回避する方法はありますか、おそらく木のある種の遅延評価ですか?
ありがとう!
編集:
iterparseを使用してみましたが、iterparse呼び出しでMemoryErrorが発生します。ファイルを複数のチャンクに分割して1つずつ処理する方法はありますか?