解析してデータベースにインポートする大きな XML ファイル (4 GB) があります。私は XMLReader で遊んでいますが、動作させることができないようで、PHP ドキュメントには動作する例があまりありません。
私の目標は、作業中の XML ファイルの次の (簡略化された) バージョンから "url" と "text" の組み合わせを抽出することです。
<everything>
<doc>
<field1>...</field2>
<url>www.theurlthatIwant.com</url>
<text>This is some text which I want to extract with the url</text>
<random>
<subrandom> </subrandom>
<subrandom> </subrandom>
<subrandom> </subrandom>
</random>
</doc>
<doc>
<field1>...</field2>
<url>www.anotherurl.com</url>
<text>This is some more text which I want to extract with the url</text>
<random>
<subrandom> ... </subrandom>
<subrandom> ... </subrandom>
<subrandom> ... </subrandom>
</random>
</doc>
...
</everything>
XMLReader を使用して「url」と「text」を取得し、残りを無視するための疑似コードは何ですか? さらに (はるかに簡単に) 処理できるように、ペアを CSV ファイルに出力する予定です。ありがとうございました!
更新しました:
それを理解して、将来の読者のために以下の回答を投稿してください。