math - サイズの異なる 2 つのベクトルのコサイン類似度の計算

Question

2つ質問があります。

ドキュメントに各単語が何回出現するかを調べて、ドキュメントからベクトルを作成しました。これはベクトルを作成する正しい方法ですか? それとも、他にも何かしなければなりませんか？
上記の方法を使用して、サイズの異なる 16 個のドキュメントのベクトルを作成しました。ここで、コサイン類似度を適用して、各ドキュメントがどの程度類似しているかを調べたいと思います。私が抱えている問題は、サイズが異なるため、2 つのベクトルのドット積を取得することです。どうすればいいですか？

score 3 · Accepted Answer

1 に答える 1