3

PostgreSQL、SQLServer、Luceneの全文検索インデックスでベンチマークを実行したいと考えています。

クエリを実行するのに適した大きなサンプルデータベースをどこで見つけるかについてのアイデアはありますか?

よろしくお願いします。

4

1 に答える 1

2

非常に大量のテキストが含まれているため、優れたソースはウィキペディアのデータベースダンプだと思います。それらはここで入手できます:http://dumps.wikimedia.org/

usenetアーカイブを試すこともできますが、ターゲット言語を選択するのが難しく、使用される言語の品質も低くなります。

于 2011-02-24T08:42:04.130 に答える