GloVe単語ベクトルを使用してPython 3.6で(正しい実装であることが検証された関数を使用して)コサイン類似度について「ally」と「friend」という2つの単語をテストしたところ、コサイン類似度は
0.6274969008615137
. しかし、「同盟国」と「友人」をテストしたところ、結果は でした0.4700224263147646
。
同義語として与えられた 2 つの名詞 "ally" と "friend" は、名詞でほとんど関係のない単語である "ally" と "powerful" よりもコサイン類似度が大きいはずです。
単語ベクトルまたはコサイン類似度の考え方を誤解していますか?