http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec
word2vec の Spark 実装では、反復またはデータ パーティションの数が 1 より大きい場合、何らかの理由でコサイン類似度が 1 より大きくなります。
私の知る限り、コサインの類似度は常に約 -1 < cos < 1 である必要があります。理由を知っている人はいますか?
http://spark.apache.org/docs/latest/mllib-feature-extraction.html#word2vec
word2vec の Spark 実装では、反復またはデータ パーティションの数が 1 より大きい場合、何らかの理由でコサイン類似度が 1 より大きくなります。
私の知る限り、コサインの類似度は常に約 -1 < cos < 1 である必要があります。理由を知っている人はいますか?