lucene - Luceneで検索クエリを提供するために使用されるインデックスファイルの順序はどれですか？

Question

Luceneに対して検索クエリが実行されると、どのファイル（http://lucene.apache.org/core/old_versioned_docs/versions/3_5_0/fileformats.htmlで説明されている）がアクセスされ、どのような順序でアクセスされますか？たとえば、クエリが用語のリストにトークン化されると、それらの用語を（ドキュメントIDの）ヒットリストに変換するためにどのファイルが使用されますか？ドキュメントIDを取得したら、関連するドキュメントをどのように検索しますか？

score 1 · Accepted Answer

通常の検索では、次のファイルからの情報が必要です。

クエリ内の用語に関する情報を取得するための用語辞書
クエリに一致するドキュメントIDを取得する頻度
- 削除されたドキュメントファイルは、削除されたドキュメントをスキップするために使用されます
- normsファイルはドキュメントのスコアリングに使用されます
- クエリで位置（フレーズクエリなど）を処理する必要がある場合は、位置ファイルも読み取られます
トップヒットの要約結果を取得するための保存されたフィールド
保存されたフィールドの内容を強調するための用語ベクトル

lucene - Luceneで検索クエリを提供するために使用されるインデックスファイルの順序はどれですか？

1 に答える 1

Related

Reference