search - Elastic.co/Elastic search - 複数のブースティングクエリによる関連性フィードバック

Question

Elastic Search (Elastic.co) の関連性フィードバックを実装しようとしています。

私は、boolean must_not の場合のように否定的な用語を除外せずに、否定的な用語を割引するという考えで、肯定的な用語と否定的な用語の指定を可能にするクエリのブースティングを認識しています。

ただし、肯定的な用語と否定的な用語の両方で、階層化されたブーストを達成しようとしています。

つまり、ビニングされたポジティブワードとネガティブワードのリストを取得し、それぞれが独自のクエリワードを含む、異なるポジティブブースト層とネガティブブースト層が存在するようなクエリを生成したいと考えています。

（疑似クエリ）のようなもの：

query{
 {
 terms: [very relevant terms]
 pos_boost: 3
 }
 {
 terms: [relevant terms]
 pos_boost: 2
 }
 {
 terms: [irrelevant terms]
 neg_boost: 0.6
 }
 {
 terms: [very irrelevant terms]
 neg_boost: 0.3
}
}

私の質問は、ネストされたブースティングクエリでこれを達成できるかどうか、または複数のshould句を使用したほうがよいかどうかです。

私の懸念は、bool クエリの should 句で 0.2 のブーストを行っても、ドキュメントのスコアがプラスに増加するかどうかわからないことです。これは、スコアを増加させるのではなく、ドキュメントを割引したいためです。 .

クエリのブースティングでは、肯定的な用語の重み付けの程度を制御できないことが懸念されます。

他の実装に関するヘルプや提案をいただければ幸いです。(私が本当にやりたかったのは、関連するドキュメントの言語モデルを作成し、それを使用してランク付けすることでしたが、エラスティックで簡単に実現する方法がわかりません。)

score 1 · Accepted Answer

または、インデックス時に言語モデルをコレクションにエンコードする場合は、ここで説明するアプローチを試すことができます: Elasticsearch: ドキュメント内のカスタムスコアフィールドを使用した影響スコアリング

search - Elastic.co/Elastic search - 複数のブースティング クエリによる関連性フィードバック

3 に答える 3

Related

Reference

search - Elastic.co/Elastic search - 複数のブースティングクエリによる関連性フィードバック