0

Lucene のファイルのインデックス作成方法を確認しました。しかし、キーと値のペアにインデックスを付ける必要があります。単一のファイルまたは少数のファイルに多くの(単語、文)の組み合わせがあるように。ほとんどの場合、それは単一のファイルにあります。

検索に使用する単語に基づいて文を検索したいと思います。Java で使用する必要があるメカニズムは何ですか?

Hadoop のシーケンス ファイルに似たもの。データ全体を解析しなくても、利用可能なすべてのキーの値を取得できるはずです。

4

1 に答える 1

0

ファイルを文に分割し、すべての文を lucene ドキュメントで索引付けして、ファイル情報をドキュメントに入れることができると思います。次に、いくつかの単語を検索して、文とファイル情報を取得できます。

例えば。doc.add(new TextField("content", content, Field.Store.YES));

`doc.add(new TextField("fileinfo", fileinfo, Field.Store.YES));`
于 2013-06-20T01:16:42.543 に答える