3

Lucene で特定のドキュメントの類似ドキュメントを見つける方法を教えてください。テキストが何であるかはわかりません。ドキュメントが何であるかしかわかりません。lucene で同様のドキュメントを見つける方法はありますか。私は初心者なので、手を握る必要があるかもしれません。

4

1 に答える 1

9

luceneのMoreLikeThis機能を確認することをお勧めします。

MoreLikeThisは、ドキュメント内の用語に基づいてluceneクエリを作成し、インデックス内の他の同様のドキュメントを検索します。

http://lucene.apache.org/java/3_0_1/api/contrib-queries/org/apache/lucene/search/similar/MoreLikeThis.html

サンプルコード例(Javaリファレンス)-

MoreLikeThis mlt = new MoreLikeThis(reader); // Pass the index reader
mlt.setFieldNames(new String[] {"title", "author"}); // specify the fields for similiarity

Query query = mlt.like(docID); // Pass the doc id 
TopDocs similarDocs = searcher.search(query, 10); // Use the searcher
if (similarDocs.totalHits == 0)
    // Do handling
}
于 2011-10-05T07:00:58.620 に答える