1

luceneを使用して全文索引付けと検索をテストする必要があります。このために、さまざまなタイプ(pdf、doc、txt、xml、json ...)の多数のファイル(約15 Gb)を探しています。

ウィキペディアのデータベースを試しましたが、xmlファイルは1つしかありません。

誰かが私にこのようなデータベースを見つける場所を提案できますか?

4

1 に答える 1

1

InnoDBで全文検索を使用してみることができます。http://dumps.wikimedia.org/を使用する方が良いでしょうが。

于 2012-11-29T18:48:03.213 に答える