2 つのインデックス付きドキュメントがあり、一方が他方よりも高い理由の関連性を理解しようとしています。だから私はDebugQuery=True
説明を得るために走った。以下は、2 つのドキュメントの関連する相違点です。
2 種類のドキュメント
関連する可能性があります。ドキュメントは、*_s フィールドを使用して区別する 2 つの異なるタイプです。したがって、私のフィールドmodule_sには2つのモジュール1と2があります。私のクエリは次のとおりです。
<arr name="filter_queries">
<str>moduleid_s:(1 OR 2)</str>
</arr>
したがって、これが問題を引き起こすとは思いませんが、この情報を追加したかったのです。
関連する説明の違い:
ドキュメント 1 - モジュール タイプ = 1
result of: 1.7325882 = score(doc=3513280,freq=1.0),
product of: 0.44456035 = queryWeight,
product of: 0.5 = boost 7.7946143 = idf(docFreq=5286,maxDocs=4721423) 0.1140686 = queryNorm 3.8973072 = fieldWeight in 3513280,
product of: 1.0 = tf(freq=1.0), with freq of: 1.0 = termFreq=1.0 7.7946143 = idf(docFreq=5286, maxDocs=4721423) 0.5 = fieldNorm(doc=3513280)
ドキュメント 2 - モジュール タイプ = 2
result of: 0.75800735 = score(doc=174,freq=1.0),
product of: 0.44456035 = queryWeight,
product of: 0.5 = boost 7.7946143 = idf(docFreq=5286,maxDocs=4721423) 0.1140686 = queryNorm 1.7050719 = fieldWeight in 174,
product of: 1.0 = tf(freq=1.0), with freq of: 1.0 = termFreq=1.0 7.7946143 = idf(docFreq=5286, maxDocs=4721423) 0.21875 = fieldNorm(doc=174)
あらすじと質問
ご覧のとおり、説明はほとんど同じです。それらはすべて同じ queryWeight、boost、idf、および queryNorm を持っています。違いは、doc=XXX です。ドキュメント 1 の場合は で351328
、ドキュメント 2 の場合は174
です。誰かがこの数字が何であるか説明できますか? それはどこから来たのですか?そして、なぜそれは異なるのですか?
使用されるリソース