私はLuceneでインデックスを作成しており、関連するドキュメントのIDをLuceneから取得することにのみ関心があります(つまり、フィールド値や強調表示情報ではありません)。これらの要件を考えると、検索のパフォーマンス(速度)や品質(結果)に影響を与えることなく、どの用語ベクトルを使用する必要がありますか?私もMoreLikeThisを使用するので、必要ありません
TermVector.YES—Records the unique terms that occurred, and their counts, in each document, but doesn’t store any positions or offsets information
TermVector.WITH_POSITIONS—Records the unique terms and their counts, and also the positions of each occurrence of every term, but no offsets
TermVector.WITH_OFFSETS—Records the unique terms and their counts, with the offsets (start and end character position) of each occurrence of every term, but no positions
TermVector.WITH_POSITIONS_OFFSETS—Stores unique terms and their counts, along with positions and offsets
ありがとう。