私はsolrを使って次のことをしようとしています:
txt ファイルからテキストを読み取り、テキストに対して MoreLikeThis を使用して、そのテキストに類似したドキュメントを見つけます。Solrでこれを行うにはどうすればよいですか?
私がこれまでに知っていることから、コンテンツストリームを使用する必要があると思いますが、設定方法がわかりません...
私はsolrを使って次のことをしようとしています:
txt ファイルからテキストを読み取り、テキストに対して MoreLikeThis を使用して、そのテキストに類似したドキュメントを見つけます。Solrでこれを行うにはどうすればよいですか?
私がこれまでに知っていることから、コンテンツストリームを使用する必要があると思いますが、設定方法がわかりません...
インデックスに格納されたドキュメントから MoreLikeThisQuery を作成する場合、インデックスから TermVector 情報を取得することでクエリを作成します。
持っているテキスト ファイルに類似したドキュメントを見つけたいので、テキスト ファイルを反復処理し、一致させたい方法でテキスト ファイル内の用語を使用して BooleanQuery を作成する必要があります。
上記は Lucene に当てはまります。また、MoreLikeThisQuery が TermVector 情報に基づいて機能することを考えると、Solr にも同じことが当てはまると思います。