私のドキュメントには、TagとSuperTagというフィールドがあります。タグが一致するたびにスコアが上がりますが、SuperTagで一致すると大幅に上がり、最初の選択肢になります。あなたの意見では、TagとSuperTagのブーストフィールドにどのような値を入れる必要がありますか?ありがとう。
1 に答える
1
答えるのは非常に難しいです。フィールドに含まれるデータと、それらが持つアナライザーの両方に大きく依存します。
明らかに、両方のデータがほぼ同じになる場合は、スーパータグ フィールドのブーストを に設定し2.0
ます。
それらが同じデータを保持していない場合、次のようなシナリオを想像できます。
{tag: 'tagnice tagnice tagnice'}
{supertag: 'tagnice'}
ブーストされたスーパータグを使用しても、tf-idf
スコアが大きくなるという理由だけで、タグの関連性が高くなる可能性があります。
これを解決するには、たとえば、フィルターを一意に設定したアナライザーを両方に設定すると役立ちます。
前述のように、データとそれを lucene に保存する方法に大きく依存します。一見、よくわからないまま、ブーストを2倍にすればうまくいく。
于 2013-03-14T14:13:44.950 に答える