libSVM を使用しています。私の機能値が次の形式であるとします。
instance1 : f11, f12, f13, f14
instance2 : f21, f22, f23, f24
instance3 : f31, f32, f33, f34
instance4 : f41, f42, f43, f44
..............................
instanceN : fN1, fN2, fN3, fN4
適用できるスケーリングは 2 つあります。
各ベクトルがゼロ平均と単位分散を持つように、各インスタンス ベクトルをスケーリングします。
( (f11, f12, f13, f14) - mean((f11, f12, f13, f14) ). /std((f11, f12, f13, f14) )
上記の行列の各列を範囲にスケーリングします。例 [-1, 1]
RBF カーネル (libSVM) を使用した実験によると、2 番目のスケーリング (2) によって結果が約 10% 向上することがわかりました。(2) で結果が改善される理由がわかりませんでした。
スケーリングを適用する理由と、2 番目のオプションで結果が改善される理由を説明してもらえますか?