machine-learning - Spark MLLib の Word2Vec コサイン類似度が 1 より大きい

翻译自：https://stackoverflow.com/questions/33360201 2015-10-27T04:54:09.227

1368 次

5

http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec

word2vec の Spark 実装では、反復またはデータパーティションの数が 1 より大きい場合、何らかの理由でコサイン類似度が 1 より大きくなります。

私の知る限り、コサインの類似度は常に約 -1 < cos < 1 である必要があります。理由を知っている人はいますか?

1 に答える 1