0

コサイン類似度のリストをパーセンテージに変換する方法はありますか? 私はこれに頭を悩ませようとしましたが、非常に疑わしいです。

次のように、4 つのドキュメントのコサイン値を正規化することは理にかなっていますか。

Doc #1  0.9600
Doc #2  0.9300
Doc #3  0.8800
Doc #4  0.8500

それらをすべてまとめると

0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200

そして、それらを正規化します。

Doc #1  0.9600 / 3.6200 = 0.2652
Doc #2  0.9300 / 3.6200 = 0.2570
Doc #3  0.8800 / 3.6200 = 0.2431
Doc #4  0.8500 / 3.6200 = 0.2348

または、これを表示するより受け入れられている方法はありますか?

4

1 に答える 1

2

ユースケースにもよると思いますが、一般に、コサイン類似度スコアはすでに 0 から 1 のスケールになっているため、正規化する必要はあまりないと思います。

于 2013-01-15T14:54:56.497 に答える