solr - 位置とオフセットインデックスなしで lucene フレーズはどのように機能しますか?

Question

Lucene では、位置とオフセットを使用して用語をインデックス化できますが、それがなくてもフレーズ検索を使用できます。では、lucene はこの情報なしでインデックスの語順をどのように計算できるのでしょうか?

score 1 · Accepted Answer

おそらく、termvectors の位置/オフセットと逆索引を混同している可能性があります。

用語ベクトルは検索には使用されません。

実際の投稿リストで近接情報を除外するには、IndexOptions.DOCS_ONLY または IndexOptions.DOCS_AND_FREQS を使用します。これを行うと、PhraseQueries が機能しなくなります。

しかし、いくつかの不正確さを許容する場合は、これらの設定を word-ngram (シングルフィルター) と組み合わせて使用すると、"近似" という高速なフレーズを作成するのに役立ちます...もちろん、近接性がないフィールドにも役立ちます。適用可能: 数値フィールド、一意の ID フィールドなど。

solr - 位置とオフセット インデックスなしで lucene フレーズはどのように機能しますか?