1つの大きなドキュメント(400 mb)があり、それぞれに独自の宣言がある数百のXMLドキュメントが含まれています。PythonのElementTreeを使用して各ドキュメントを解析しようとしています。情報を解析するために各XMLドキュメントを分割するのに多くの問題があります。ドキュメントがどのように見えるかの例を次に示します。
<?xml version="1.0"?>
<data>
<more>
<p></p>
</more>
</data>
<?xml version="1.0"?>
<different data>
<etc>
<p></p>
</etc>
</different data>
<?xml version="1.0"?>
<continues.....>
理想的には、各XML宣言を読み、データを解析して、次のXMLドキュメントに進みたいと思います。任意の提案が役立ちます。