2

私は tf-idf モデルに取り組んでいます。このモデルがどのように実装されているかについて、私はほとんど混乱していません。同じ用語に対して異なる値を与えているモデルを印刷しようとしているときに、モデルを構築しました。次の 2 つの項については、これらの結果が得られます。

doc_bow = [(0, 1), (1, 1)]
val1= tf_idf_corpus[doc_bow] 

doc_bow = [(0,1)]
val2=tf_idf_corpus[doc_bow] 

結果は次のとおりです。

val1= [(0, 0.56486634414605663), (1, 0.82518241210720711)]
val2=[(0, 1.0)]

用語0のtf-idf値がval1で0.5648、val2で1.0である理由を知りたいだけです。

4

1 に答える 1