0

私のSOLRドキュメントはワインエンティティです。ユーザーがキーワード「HautBailly」(ボルドーのワイン)を検索するとき、最初に、タイトルの長さが短い、厳密に一致するドキュメントを取得したいと思います。例:

  1. 「ChâteauHaut-Bailly-Pessac-Léognan」
  2. 「ChâteauHaut-BaillyLaPardedeHautBailly-Pessac-Léognan」

ただし、デフォルトのsolrクエリでは、キーワード「hautbaily」は次のランキングを返します。

  1. 「ChâteauHaut-BaillyLaPardedeHautBailly-Pessac-Léognan」
  2. 「ChâteauHaut-Bailly-Pessac-Léognan」

検索されたフレーズ(長さの点で)と短いフィールド(ここではタイトル)に近い試合のスコアを上げるために遊ぶことができるパラメーターはありますか?ここで、適切なワイン( "ChâteauHaut-Bailly-Pessac-Léognan")がランキングに登場しますか?

ありがとうございました!

4

2 に答える 2

0

デフォルトのスコアリングはすでにそれを行っていると思います(omitNormsでノルムを省略していない場合)。最初のドキュメントのスコアが高くなるのは、検索が 2 回行われるためです (使用しているトークナイザー/パーサーに応じて、Haut-Bailly または単語の 1 つに一致する可能性が最も高い)。

于 2012-09-18T17:13:00.110 に答える
0

重複フィルターを使用するとうまくいくかもしれません http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.RemoveDuplicatesTokenFilterFactory

于 2012-09-19T04:03:19.837 に答える