私はいくつかの SVM 実装で遊んでいて、疑問に思っています - 特徴値を正規化して 1 つの範囲に収める最良の方法は何ですか? (0 から 1 まで)
次の範囲の値を持つ 3 つの機能があるとします。
3 - 5。
0.02 - 0.05
10-15。
これらの値をすべて [0,1] の範囲に変換するにはどうすればよいですか?
トレーニング中に遭遇する特徴番号 1 の最大値が 5 で、モデルをさらに大きなデータセットで使用し始めた後、7 という高い値に出くわした場合はどうなりますか? すると、換算範囲では1を超えてしまいます...
トレーニング中に値を正規化して、トレーニング中にモデルが「見た」最高値 (または最低値) を超える「野生の値」の可能性を考慮するにはどうすればよいですか? モデルはそれにどのように反応し、それが起こったときに適切に機能させるにはどうすればよいでしょうか?