0

Luceneのアナライザーがインデックスを構築するためのtf-idf表現を使用しているかどうかを知りたいです。

ありがとう

4

1 に答える 1

2

いいえ:アナライザーは、ドキュメントをトークンのストリームに分割するだけです。

IndexWriterは、転置インデックスを作成する分析コンシューマーであり、ドキュメントに出現する用語の数や用語を含むドキュメントの数などの生の統計を記録します。

ただし、これはtf / idf表現ではありません。インデックス形式は、スコアリングモデルに依存しません。

于 2012-05-25T06:51:48.940 に答える