Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Lucene のファイルのインデックス作成方法を確認しました。しかし、キーと値のペアにインデックスを付ける必要があります。単一のファイルまたは少数のファイルに多くの(単語、文)の組み合わせがあるように。ほとんどの場合、それは単一のファイルにあります。
検索に使用する単語に基づいて文を検索したいと思います。Java で使用する必要があるメカニズムは何ですか?
Hadoop のシーケンス ファイルに似たもの。データ全体を解析しなくても、利用可能なすべてのキーの値を取得できるはずです。
ファイルを文に分割し、すべての文を lucene ドキュメントで索引付けして、ファイル情報をドキュメントに入れることができると思います。次に、いくつかの単語を検索して、文とファイル情報を取得できます。
例えば。doc.add(new TextField("content", content, Field.Store.YES));
doc.add(new TextField("content", content, Field.Store.YES));
`doc.add(new TextField("fileinfo", fileinfo, Field.Store.YES));`