3

Lucene では、位置とオフセットを使用して用語をインデックス化できますが、それがなくてもフレーズ検索を使用できます。では、lucene はこの情報なしでインデックスの語順をどのように計算できるのでしょうか?

4

1 に答える 1

1

おそらく、termvectors の位置/オフセットと逆索引を混同している可能性があります。

用語ベクトルは検索には使用されません。

実際の投稿リストで近接情報を除外するには、IndexOptions.DOCS_ONLY または IndexOptions.DOCS_AND_FREQS を使用します。これを行うと、PhraseQueries が機能しなくなります。

しかし、いくつかの不正確さを許容する場合は、これらの設定を word-ngram (シングルフィルター) と組み合わせて使用​​すると、"近似" という高速なフレーズを作成するのに役立ちます...もちろん、近接性がないフィールドにも役立ちます。適用可能: 数値フィールド、一意の ID フィールドなど。

于 2012-03-12T18:32:18.953 に答える