PostgreSQL、SQLServer、Luceneの全文検索インデックスでベンチマークを実行したいと考えています。
クエリを実行するのに適した大きなサンプルデータベースをどこで見つけるかについてのアイデアはありますか?
よろしくお願いします。
PostgreSQL、SQLServer、Luceneの全文検索インデックスでベンチマークを実行したいと考えています。
クエリを実行するのに適した大きなサンプルデータベースをどこで見つけるかについてのアイデアはありますか?
よろしくお願いします。
非常に大量のテキストが含まれているため、優れたソースはウィキペディアのデータベースダンプだと思います。それらはここで入手できます:http://dumps.wikimedia.org/
usenetアーカイブを試すこともできますが、ターゲット言語を選択するのが難しく、使用される言語の品質も低くなります。