システムにある各テキストベースのアイテムをベクトル空間モデルのベクトルとして表現したいと考えています。用語の値は、正または負のクラスの用語の頻度を反映する負または正の値にすることができます。ゼロ値はニュートラルを意味します。たとえば、次のようになります。
アイテム1 (-1,0,-5,4.5,2)
項目 2 (2,6,0,-4,0.5)
私の質問は次のとおりです。
1- ベクトルを [0 から 1] の範囲に正規化するにはどうすればよいですか。
.5 は、正規化前のゼロを意味します
.5> 正の場合
.5< 負の場合
そのようなことを行う数式があるかどうか知りたいです。
2- 正規化後、類似度の選択は異なりますか?? たとえば、コサイン類似度を使用できますか?
3- 正規化後に次元削減を行うと難しいでしょうか??
前もって感謝します