(長い) パッセージに似たテキストを含むドキュメントを Solr にクエリする最も簡単な方法は何ですか? これは、ElasticSearchmatch
クエリが行うことや、Indri のような確率的検索エンジンがデフォルトで行うことと似ています。and
これは、とor
クエリの間の何かです。どの用語も必須ではありませんが、多くの用語を含むドキュメントが得られます。生のテキストのパッセージをエンジンに渡すだけで、クライアントでテキストの解析やトークン化を試みることなく、そのパッセージと重複する語句が多いドキュメントを返すこともできます。Solr クエリ リファレンスで確認できる最善の方法は、クエリ テキストを自分でトークン化し、用語の各ペアの間に OR を挿入して、上位 N 個の結果を返すことです。Solrでそれを行うより簡潔な方法はありますか?
2875 次
1 に答える
3
上記の答えは正しいです。インデックス内の別のドキュメントに類似したドキュメント、特定の外部 URL に類似したドキュメント、または特定のテキストに類似したドキュメントを検索することを選択できます。対象とするフィールドやその他のさまざまなパラメーターを選択できます。MLT の公式の Solr リファレンス ガイド ドキュメント ページは次のとおりです: https://cwiki.apache.org/confluence/display/solr/MoreLikeThis
于 2013-10-08T20:51:54.440 に答える