DeepLearning4j フレームワークで ParagraphVector ツールを使用しています。私がやっていることは、一連のテキスト ドキュメントでモデルをトレーニングし、それらのドキュメント間の類似性を計算することです。
さて、参照ページ ( http://deeplearning4j.org/word2vec ) にあるように、ツールが類似度を計算するために使用するメトリックはコサイン類似度であり、これは 0 から 1 の間に含まれる必要があります。負のスコアを取得します。
それがなぜなのか誰にもわかりますか?
前もって感謝します。