私はドキュメント間のコサイン類似性を見つけています..私はこのようにしました
D1 =(8,0,0,1)ここで、8,0,0,1は、項t1、t2、t3、t4のtf-idfスコアです。
D2 =(7,0,0,1)
cos(theta)=(56 + 0 + 0 + 1)/ sqrt(64 + 49)sqrt(1 +1)
になります
cos(シータ)= 5
さて、この値から何を評価しますか... cos(theta)= 5がそれらの間の類似性について何を意味するのかわかりません...私は正しいことをしていますか?