apache - Solr で MoreLikeThis 関数を使用して、テキストファイルに類似したドキュメントを検索するにはどうすればよいですか?

Question

私はsolrを使って次のことをしようとしています:

txt ファイルからテキストを読み取り、テキストに対して MoreLikeThis を使用して、そのテキストに類似したドキュメントを見つけます。Solrでこれを行うにはどうすればよいですか?

私がこれまでに知っていることから、コンテンツストリームを使用する必要があると思いますが、設定方法がわかりません...

score 1 · Accepted Answer

インデックスに格納されたドキュメントから MoreLikeThisQuery を作成する場合、インデックスから TermVector 情報を取得することでクエリを作成します。

持っているテキストファイルに類似したドキュメントを見つけたいので、テキストファイルを反復処理し、一致させたい方法でテキストファイル内の用語を使用して BooleanQuery を作成する必要があります。

上記は Lucene に当てはまります。また、MoreLikeThisQuery が TermVector 情報に基づいて機能することを考えると、Solr にも同じことが当てはまると思います。

apache - Solr で MoreLikeThis 関数を使用して、テキスト ファイルに類似したドキュメントを検索するにはどうすればよいですか?