search - Lucene: IndexReader を開く計算コストは、インデックスのサイズによってどのように増加しますか?

Question

つまり、インデックスのサイズが劇的に (たとえば 1GB から 1TB に) 増加した場合、そのインデックスを超える IndexReader を開くための計算コストはどのように増加するのでしょうか? それは直線的な傾向ですか？

score 2 · Accepted Answer

傾向は線形ですが、その前の定数は小さいはずです。また、コストはほとんどが CPU ではなく IO です。

IndexReader は、用語インデックス、削除されたドキュメントのビットベクトル、norms/FieldCache/doc 値などの特定のデータ構造を事前に読み込みます (それらを必要とする最初のクエリで)。フィールドキャッシュを除いて、これらの構造のロードはほとんどが IO (CPU ではなく) コストであり、コストはドキュメントごとに非常に低い一定の係数である必要があります。

重い/大きなもの (投稿、格納されたフィールド、用語ベクトル) はすべてディスクに残されます。

search - Lucene: IndexReader を開く計算コストは​​、インデックスのサイズによってどのように増加しますか?

1 に答える 1

Related

Reference

search - Lucene: IndexReader を開く計算コストは、インデックスのサイズによってどのように増加しますか?