大きなテキストドキュメントがあります。たとえば、「computer m」を検索すると、「computer monitor」、「computer memory」、「computermarketshare」が必要になります。一致するフレーズのみを取得するにはどうすればよいですか?
ShingleAnalyzerWrapperを使用してファイルにインデックスを付ける必要がありますか?この目的でSpellCheckerを使用する必要がありますか?
これどうやってするの?
大きなテキストドキュメントがあります。たとえば、「computer m」を検索すると、「computer monitor」、「computer memory」、「computermarketshare」が必要になります。一致するフレーズのみを取得するにはどうすればよいですか?
ShingleAnalyzerWrapperを使用してファイルにインデックスを付ける必要がありますか?この目的でSpellCheckerを使用する必要がありますか?
これどうやってするの?
そのためにMultiPhraseQueryを使用できます。
org.apache.lucene.search.highlight.Highlighterは、見つかったドキュメントから最も一致するテキストを抽出するために使用されます。Googleが検索結果で一致するテキストを強調表示(または太字で表示)する方法とよく似ています。
開始に役立つ可能性のあるこのブログエントリ:http: //hrycan.com/2009/10/25/lucene-highlighter-howto/