5

大規模なプロジェクト用にいくつかの大規模な SOLR インデックスがあり、50 GB を超えるスペースを消費します。

インデックスのコンテンツの変更に関連するサイズを縮小する方法をいくつか検討しましたが、サイズを 2 桁縮小する SOLR インデックスに変更を加えることができるかどうかに興味があります。これらは、(1) 実行できる保守コマンド、または (2) 正しく設定されていない可能性がある単純な構成パラメーターのいずれかに直接関連しています。

別の関連する質問は、(3) SOLR 内でパフォーマンスのためにインデックス サイズを交換する方法はありますか? もしそうなら、それはどのように機能しますか?

これについての考えをいただければ幸いです...ありがとう!

4

1 に答える 1

12

パフォーマンスとインデックス サイズを交換するためにできることがいくつかあります。たとえば、整数 (int) フィールドはトライ整数 (tint) よりも少ないスペースを使用しますが、範囲クエリは int を使用すると遅くなります。

インデックスを大幅に削減するには、ほぼ確実に、使用しているフィールドをより詳しく調べる必要があります。

  • 多くの保存されたフィールドを使用していますか? その場合は、Solr から結果が返ってきたら、格納されているフィールドをインデックスから削除し、データベースに必要なデータをクエリしてみてください。
  • 長さの正規化が不要なテキスト フィールドに omitNorms="true" を追加します
  • フレーズ一致を必要としないテキスト フィールドに omitPositions="true" を追加します
  • NGrams などの特別なフィールドは、多くのスペースを占有する可能性があります
  • テキストフィールドからストップワードを削除していますか?
于 2012-04-09T23:42:09.180 に答える