0

単語数が異なる 2 つの文書間でコサイン類似度を見つけたい場合、規則はありますか?

4

1 に答える 1

2

標準式では、一致する単語数は必要ありません。両方のドキュメントの単語の結合を合計することができます。B にあるが A にはないすべての単語は、A の単語ベクトルで 0 を生じさせます。A にあり、B にはないすべての単語は、B の単語ベクトルで 0 を生じさせます。

于 2013-09-17T14:24:10.597 に答える