Google やさまざまなフォーラムで大きな XML ファイルを検索しましたが、DBLP は 1.0 GB で、私のニーズには大きすぎて、何も見つかりませんでした。30 ~ 50 MB、100 ~ 300 MB、および 500 MB 程度のセットが必要です。誰か知っていますか?
ps意味のあるクエリでテストするために実際のデータが必要なので、データジェネレーターを提案しないでください。
最後に、良いデータセットを見つけました。http://dumps.wikimedia.org/mirrors.htmlこれらは 、ウィキペディアを含むさまざまなウィキからのデータセットです。10MB から 500-600MB までのさまざまなサイズのデータセットを見つけることができます。
openstreetmapデータベース全体を250GBのxmlとしてダウンロードできます。これは、テストに十分な大きさである必要があります。
XSLT を使用すると、いつでも任意のサイズの XML ドキュメントを生成できます。
これはよく知られている XML ドキュメント インスタンス (44GB、3.8GB 圧縮) の 1 つ、CityGml ファイルです。