0

Luceneに対して検索クエリが実行されると、どのファイル(http://lucene.apache.org/core/old_versioned_docs/versions/3_5_0/fileformats.htmlで説明されている)がアクセスされ、どのような順序でアクセスされますか?たとえば、クエリが用語のリストにトークン化されると、それらの用語を(ドキュメントIDの)ヒットリストに変換するためにどのファイルが使用されますか?ドキュメントIDを取得したら、関連するドキュメントをどのように検索しますか?

4

1 に答える 1

1

通常の検索では、次のファイルからの情報が必要です。

  1. クエリ内の用語に関する情報を取得するための用語辞書
  2. クエリに一致するドキュメントIDを取得する頻度
    • 削除されたドキュメントファイルは、削除されたドキュメントをスキップするために使用されます
    • normsファイルはドキュメントのスコアリングに使用されます
    • クエリで位置(フレーズクエリなど)を処理する必要がある場合は、位置ファイルも読み取られます
  3. トップヒットの要約結果を取得するための保存されたフィールド
  4. 保存されたフィールドの内容を強調するための用語ベクトル
于 2013-03-12T08:40:47.320 に答える