0

lucene ライブラリを使用して、インデックス作成時間、インデックス サイズ、検索時間を見積もる方法を検索します。

500 ファイルの数があり、5000 ドキュメントの価値を見積もりたいと思います。

ウェブで検索しましたが、論文の数を見積もる良い方法が見つかりませんでした。

4

1 に答える 1

0

答えは、インデックスに何を入れるかによって大きく異なります。明らかに、完全なフィールドコンテンツを保存する場合、1から1桁以内の係数で、少なくとも線形の成長を期待できます。用語にインデックスを付けるだけの場合、必要なスペースははるかに少なくなりますが、同時に見積もりはるかに困難になります。たとえば、一意のインデックス用語の数は非常に重要な要素です。これはおそらく、コンテンツの詳細に大きく依存するいくつかの数で横ばいになり始めます。全体として、そのような場合、測定はおそらくあなたの唯一の信頼できる方法です。

于 2012-03-30T10:55:52.353 に答える