クエリを実行する必要がある xml ドキュメントがいくつかあります。私はそれを使用することに漠然と慣れているので、これを行うためにいくつかの Python スクリプト (ElementTree を使用) を作成しました。
それが機能する方法は、何を調べたいかに応じて、さまざまな引数でスクリプトを数回実行することです。
これらのファイルは比較的大きく (10MB 以上) あるため、解析にはかなり長い時間がかかります。私のシステムでは、ただ実行しています:
tree = ElementTree.parse(document)
約 30 秒かかり、その後の findall クエリでは約 1 秒しか追加されません。
私がこれを行っている方法では、ファイルを繰り返し解析する必要があるため、後続のクエリで ElementTree.parse の計算を削減できるように、使用できる何らかのキャッシュメカニズムがあるかどうか疑問に思っていました。
ここで実行する賢明な方法は、python スクリプトでできるだけ多くのクエリをまとめてバッチ処理することかもしれませんが、別の方法があることを期待していました。
ありがとう。