私はこの質問を読んでいました:
Locality Sensitive Hashing を理解する方法は?
しかし、コサイン類似度を計算する式は次のとおりであることがわかりました: Cos(v1, v2) = Cos(theta) = (ハミング距離/署名の長さ) * pi = ((h/b) * pi )
つまり、ベクトルが完全に類似している場合、ハミング距離はゼロになり、コサイン値は 1 になります。しかし、ベクトルが完全に類似していない場合、ハミング距離はシグネチャの長さに等しくなるため、cos( pi) -1 になります。類似度は常に 0 と 1 の間であるべきではありませんか?