約 5 億のドキュメントの Lucene (4.1) インデックスがあります。その上に検索インターフェースを構築しようとしましたが、パフォーマンスの問題が発生しました。
最初に、MatchAllDocumentsQuery
. この検索には時間がかかります (約 10 秒)。これは、私が使用しているコレクターのせいだと思います。これは、総ヒット数を見つけようとするものですTotalHitCountCollector
。
クエリを時間制限できるようにしたいので、TimeLimitingCollector
. 残念ながら、API ドキュメントは少し怪しいです。あまり文書化されていないカウンターを使用します。
TimeLimitingCollector
Lucene 4.x でを使用した経験のある人はいますか? もしそうなら、総ヒット数を推測する方法はありますか?
https://builds.apache.org/job/Lucene-Artifacts-4.x/javadoc/core/org/apache/lucene/search/TimeLimitingCollector.htmlと例を読みましたが、設定が明確ではありませんとCounter
組み合わせて使用する方法numTicks