solr - Solr シノニムが正しく機能しない

Question

ユーザーがメニュー項目を検索できる大規模なレストランメニューデータベースがあります。言葉が並んでいるとユニークな料理になるアイテムがたくさんありますが、言葉は非常に一般的であり、いたるところに現れます。

例: ユーザーが「チーズステーキ」を検索したい場合、データベースで...「チーズステーキ」または「チーズステーキ」の可能性があります。

私の同義語ファイルには次のものがあります。

cheesesteak     => cheesesteak, cheese steak
cheese steak    => cheesesteak, cheese steak

「cheesesteak」を検索すると、有効な結果が得られます。「チーズステーキ」と「チーズステーキ」（言葉を並べて）のメニュー項目を取得します

しかし、「チーズステーキ」を検索すると、「ブルーチーズのステーキサラダ」のように、チーズとステーキという単語が含まれるあらゆる種類の関連性のない結果が表示されます。

この同義語ファイルが機能するように構成する方法はありますか? ユーザーに引用符などの入力を強制したくありません。

score 1 · Accepted Answer

あなたが探しているのは近接検索です。正しい順序と単語の距離でスコアが向上します。Solr FAQから

近接検索は、ずさんなフレーズクエリで実行できます。ドキュメント内で 2 つの用語が近くにあるほど、スコアは高くなります。ずさんなフレーズクエリでは、最大の「slop」、または一致を取得するためにトークンを移動する必要がある位置の数が指定されます。

標準リクエストハンドラのこの例では、「movie」の 100 語以内に「batman」が含まれるすべてのドキュメントを検索します。

q=text:"バットマン映画"~100

score 0 · Accepted Answer

あなたがすべきことは、edismax を使用して、ブースティングに最も関連性の高いドキュメントを表示させることです。ブースティングクエリまたはオプションのフレーズをすべての用語で追加する場合は、標準ハンドラーを使用してこれを行うこともできます+cheese +steak ("cheesesteak"^100 "steak cheese"^50)

solr - Solr シノニムが正しく機能しない

2 に答える 2

Related

Reference