1

私はsolrを使って次のことをしようとしています:

txt ファイルからテキストを読み取り、テキストに対して MoreLikeThis を使用して、そのテキストに類似したドキュメントを見つけます。Solrでこれを行うにはどうすればよいですか?

私がこれまでに知っていることから、コンテンツストリームを使用する必要があると思いますが、設定方法がわかりません...

4

1 に答える 1

1

インデックスに格納されたドキュメントから MoreLikeThisQuery を作成する場合、インデックスから TermVector 情報を取得することでクエリを作成します。

持っているテキスト ファイルに類似したドキュメントを見つけたいので、テキスト ファイルを反復処理し、一致させたい方法でテキスト ファイル内の用語を使用して BooleanQuery を作成する必要があります。

上記は Lucene に当てはまります。また、MoreLikeThisQuery が TermVector 情報に基づいて機能することを考えると、Solr にも同じことが当てはまると思います。

于 2013-03-07T22:10:30.940 に答える