5

http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec

word2vec の Spark 実装では、反復またはデータ パーティションの数が 1 より大きい場合、何らかの理由でコサイン類似度が 1 より大きくなります。

私の知る限り、コサインの類似度は常に約 -1 < cos < 1 である必要があります。理由を知っている人はいますか?

4

1 に答える 1