1

Solr で静的値をブーストする最良の方法は何3.6.2ですか?

各ドキュメントには1 つの(KeywordTokenized)source値 (情報源) があり、いくつかは他よりも重要であると表現したいと思います。それが助けになるなら、完全なコンテンツ制御が可能です。

http://localhost:8080/solr/index/select?fl=source,score
  &defType=edismax
  &qf=title^4
  &q=qux
  &bq=source:foo^10
  &bq=source:bar^14

残念ながら、追加のブースト クエリはほとんど効果がありません。解析されたクエリは次のようになります (qux は qu にステミングされます)。

+DisjunctionMaxQuery(((title:qux qu)^4.0))) source:foo^10.0 source:bar^14.0

あまり考慮されていない上位 2 つの結果のデバッグ クエリbq=source:foo^10

5.366351 = (MATCH) sum of: 5.366351 = (MATCH) sum of: 2.067319 = (MATCH) weight(title:qux in 4472), product of: 0.5513683 = queryWeight(title:qux), product of: 7.4988675 = idf(docFreq=35, maxDocs=23918) 0.073526874 = queryNorm 3.7494338 = (MATCH) fieldWeight(title:qux in 4472), product of: 1.0 = tf(termFreq(title:qux)=1) 7.4988675 = idf(docFreq=35, maxDocs=23918) 0.5 = fieldNorm(field=title, doc=4472) 3.299032 = (MATCH) weight(title:qu in 4472), product of: 0.69651634 = queryWeight(title:qu), product of: 9.472949 = idf(docFreq=4, maxDocs=23918) 0.073526874 = queryNorm 4.7364745 = (MATCH) fieldWeight(title:qu in 4472), product of: 1.0 = tf(termFreq(title:qu)=1) 9.472949 = idf(docFreq=4, maxDocs=23918) 0.5 = fieldNorm(field=title, doc=4472)

5.281746 = (MATCH) sum of: 4.134638 = (MATCH) sum of: 4.134638 = (MATCH) weight(title:qux in 4402), product of: 0.5513683 = queryWeight(title:qux), product of: 7.4988675 = idf(docFreq=35, maxDocs=23918) 0.073526874 = queryNorm 7.4988675 = (MATCH) fieldWeight(title:qux in 4402), product of: 1.0 = tf(termFreq(title:qux)=1) 7.4988675 = idf(docFreq=35, maxDocs=23918) 1.0 = fieldNorm(field=title, doc=4402) 1.147108 = (MATCH) weight(source:foo^10.0 in 4402), product of: 0.45919293 = queryWeight(source:foo^10.0), product of: 10.0 = boost 2.4980958 = idf(docFreq=5346, maxDocs=23918) 0.018381719 = queryNorm 2.4980958 = (MATCH) fieldWeight(source:foo in 4402), product of: 1.0 = tf(termFreq(source:foo)=1) 2.4980958 = idf(docFreq=5346, maxDocs=23918) 1.0 = fieldNorm(field=source, doc=4402)

興味深いことに、フィールドに値が含まれているにもかかわらず、最初の結果にはforがありません。 レンマタイゼーションのために少し異なりますqueryWeightsourcesourcefieldNorm

4

1 に答える 1

2

この問題は、queryNorm が原因である可能性が最も高いです。参照: http://lucene.472066.n3.nabble.com/QueryNorm-and-FieldNorm-td1992964.html

異なるクエリのスコアに基づいて結果を比較しない限り、1 回の検索内での関連性の順序付けは問題ありません。

于 2014-03-13T21:18:24.310 に答える