SOLR と LUCENE で使用されるスコアリング メカニズムをより簡単な言葉で比較するために、誰かが説明 (または参照を引用) できますか。それらに違いはありますか?
私はsolr/luceneが得意ではありませんが、私の発見はそれらが異なるかのように示しました.
PS: 「+Contents:risk」のような単純なクエリを試しただけで、他のフィルタは使用しませんでした。
SOLR と LUCENE で使用されるスコアリング メカニズムをより簡単な言葉で比較するために、誰かが説明 (または参照を引用) できますか。それらに違いはありますか?
私はsolr/luceneが得意ではありませんが、私の発見はそれらが異なるかのように示しました.
PS: 「+Contents:risk」のような単純なクエリを試しただけで、他のフィルタは使用しませんでした。
Lucene は、Vector 空間モデルの概念を使用してドキュメントのスコアを計算します。要約すると、クエリとドキュメントはベクトルと見なすことができます。特定のクエリのドキュメントのスコアを計算するために、Lucene は各ドキュメントのベクトルがクエリのベクトルからどれだけ近いかを計算します。ドキュメントが VSM のクエリに近いほど、スコアが高くなります。詳細については、Lucene のSimilarityクラスと Lucene のスコアリングドキュメントを参照してください。
実際の式は、Similarity javadocsにあります。
関連するパラメーターの概要と、その意味の簡単な説明を次に示します。
Solr は内部で Lucene を使用し、デフォルトで Solr はデフォルトの Lucene 類似性アルゴリズムを使用します。