結果を改善するために、フレーズをグループ化しようとしています。
たとえば、ユーザーが「エアコンのフィルターはいつ交換する必要がありますか?」などの質問をしたとします。「エアコン」などのドメイン固有のフレーズを使用すると、R&R は「空気」という用語を含み「コンディショニング」を含まない回答を返すか、エア バッグやエア フィルターなどの他の用語を含む回答を返します。
これは、生の Solr インスタンスを使用して実現でき、引用符の間にフレーズを設定できます。したがって、Solr クエリは次のようになります。
...
"debug": {
"rawquerystring": "When do I have to change the filter of my \"air conditioning\" ?",
"querystring": "When do I have to change the filter of my \"air conditioning\" ?",
"parsedquery": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my PhraseQuery(text:\"air conditioning\") text:?",
"parsedquery_toString": "text:when text:do text:i text:have text:to text:change text:the text:filter text:of text:my text:\"air conditioning\" text:?",
...
ただし、R&R ガイドには次のように記載されています。
構文は、次のように標準の Solr 構文とは異なります。
単一の用語またはフレーズを検索できます。Solr のようにフレーズを二重引用符で囲む必要はありませんが、クエリにフレーズを含めることができ、それらはランカー モデルによって考慮されます。
上記の声明に関する詳細は見つかりませんでした。
しかし、私たちが理解しているように、ランカーはフレーズを識別することになっています。その場合、ランカーを調整するために語句の辞書を設定できる方法はないかと考えていました。または、独自の法的表現モデルを設定できますか? この目標を達成するためのオプションは何ですか?
ありがとう