0

大きなテキストドキュメントがあります。たとえば、「computer m」を検索すると、「computer monitor」、「computer memory」、「computermarketshare」が必要になります。一致するフレーズのみを取得するにはどうすればよいですか?

ShingleAnalyzerWrapperを使用してファイルにインデックスを付ける必要がありますか?この目的でSpellCheckerを使用する必要がありますか?

これどうやってするの?

4

2 に答える 2

0

そのためにMultiPhraseQueryを使用できます。

于 2012-12-09T17:16:07.887 に答える
0

org.apache.lucene.search.highlight.Highlighterは、見つかったドキュメントから最も一致するテキストを抽出するために使用されます。Googleが検索結果で一致するテキストを強調表示(または太字で表示)する方法とよく似ています。

開始に役立つ可能性のあるこのブログエントリ:http: //hrycan.com/2009/10/25/lucene-highlighter-howto/

于 2012-12-10T17:01:23.760 に答える