1

大きな Lucene インデックスの最適化について質問があります (現在は 197 Gb です。一部の人にとってはそれほど大きくないように聞こえるかもしれません)。バージョン 2.9.4 の Lucene を使用していますが、900 セグメントのインデックスをより少ない数のセグメント (理想的には 1 ~ 10) に最適化する必要がある状態になりました。私はまだ 2.9.4 で利用可能な IndexWriter.optimize() を呼び出していますが、マージ ファクターの設定は同じように失敗します。

そのため、ログを最適化してから 1 時間後 (考えられるすべてのログを設定しました)、最適化が完了し、ログ ファイルにエラーはありません。インデックス ディレクトリ内のファイルがまだ同じであるという事実を除いて、すべて問題ないように見えます。削減または削除されたファイルの数はありません。ドライブ (300 Gb) に十分なスペースがあり、開いているリーダーやサーチャーはありません。インデックスは分離され、最適化に重点が置かれています。

インデックス wirter ログによると、マージ スレッドはセグメントをマージし、900 から 456 までのいくつかのセグメントを繰り返し出力します。その後、突然、最大 16 個のセグメントまですべてをマージしていると表示されます (これは、マージするように設定したセグメントの数です)。 )

誰が何が起こるか知っていますか?マージするセグメントが多すぎますか? 「Too Many File Handlers Open」のような OS 関連 (Windows Server 2008) の問題はありますか (そのメッセージはどこで確認できますか)? 前もって感謝します

4

1 に答える 1