2

約 50M のドキュメントのインデックスを作成しました (これらのドキュメントは非常に短いものです)。また、インデックスに対して実行したい約 1M のクエリもあります。クエリを順次選択してインデックスに対して実行するのは簡単ですが、非常に時間がかかります。

検索を並列化しようとしましたが (これはまだ遅いです)、既に RAM にあるインデックスに対して複数のサーチャーを実行しました。それでもパフォーマンスが向上しないので、並列検索が Lucene でサポートされているか、インデックスがメモリ内にあることを考慮して効率的に実行する方法があるかどうかを確認します。

4

1 に答える 1

4

インデックスが RAM にあることをどのように確認しますか? を使用していLucene’s MMapDirectoryますか?

また、あなたはで開いIndexReaderていreadOnly=trueますか?

ちなみに、GC に負荷がかかるのでRAMDirectory使用は避けてください。

于 2012-10-01T21:45:50.740 に答える