1

私のドキュメントには、TagとSuperTagというフィールドがあります。タグが一致するたびにスコアが上がりますが、SuperTagで一致すると大幅に上がり、最初の選択肢になります。あなたの意見では、TagとSuperTagのブーストフィールドにどのような値を入れる必要がありますか?ありがとう。

4

1 に答える 1

1

答えるのは非常に難しいです。フィールドに含まれるデータと、それらが持つアナライザーの両方に大きく依存します。

明らかに、両方のデータがほぼ同じになる場合は、スーパータグ フィールドのブーストを に設定し2.0ます。

それらが同じデータを保持していない場合、次のようなシナリオを想像できます。

{tag: 'tagnice tagnice tagnice'}

{supertag: 'tagnice'}

ブーストされたスーパータグを使用しても、tf-idfスコアが大きくなるという理由だけで、タグの関連性が高くなる可能性があります。

これを解決するには、たとえば、フィルターを一意に設定したアナライザーを両方に設定すると役立ちます。

前述のように、データとそれを lucene に保存する方法に大きく依存します。一見、よくわからないまま、ブーストを2倍にすればうまくいく。

于 2013-03-14T14:13:44.950 に答える