コサイン類似度のリストをパーセンテージに変換する方法はありますか? 私はこれに頭を悩ませようとしましたが、非常に疑わしいです。
次のように、4 つのドキュメントのコサイン値を正規化することは理にかなっていますか。
Doc #1 0.9600
Doc #2 0.9300
Doc #3 0.8800
Doc #4 0.8500
それらをすべてまとめると
0.9600 + 0.9300 + 0.8800 + 0.8500 = 3.6200
そして、それらを正規化します。
Doc #1 0.9600 / 3.6200 = 0.2652
Doc #2 0.9300 / 3.6200 = 0.2570
Doc #3 0.8800 / 3.6200 = 0.2431
Doc #4 0.8500 / 3.6200 = 0.2348
または、これを表示するより受け入れられている方法はありますか?