14

私はそれらが何であるかを理解していません。それらがどのように機能するかの実装の詳細があまりなくても、それらが世界にどのような価値をもたらすかを示す簡単な説明を本当に感謝します.

4

2 に答える 2

13

ノルムは、スコアの計算の一部です。ノルムは好きなように計算できます。ノルムを際立たせる主な点は、インデックス時に計算されることです。一般に、スコアに影響を与えるその他の要因は、ドキュメントがクエリにどの程度一致しているかに基づいて、クエリ時に計算されます。norm代わりに、ドキュメントと一緒に保存することで、クエリのパフォーマンスを節約します。

標準の実装は、Lucene のTFIDFSimilarityにあり、詳しく説明されています。そこでは、設定されたフィールド ブースト (フィールドに複数が設定されている場合はすべてのフィールド ブーストの積) と "lengthNorm" (短いドキュメントの一致をより重視するように設計された計算係数) の積です。これらはどちらもクエリの構成に依存しないため、代わりにインデックス時に計算して格納することをお勧めします。

次に、それらは圧縮された非常に損失の多いシングルバイト形式で保存されます (有効桁数が約 1 桁の精度で)。

于 2013-07-08T22:26:12.407 に答える