training-data - 一般化を促進するためにデータを中心化/正規化するのはいつですか?

翻译自：https://stackoverflow.com/questions/15424316 2013-03-15T03:44:42.923

143 次

高次元のデータセットが与えられ、PCA またはその他の次元削減手法をデータに適用すると、多くの場合、センタリングと正規化が必要になります。トレーニング/テスト/検証セットに分割するデータセットを指定すると、センタリングと正規化はトレーニングセットに対してのみ実行し、各変数の値 (平均値/標準偏差) を保存する必要があるようです。次に、検証/テストのエラー率を計算するときに、これらのパラメーターの固有の値ではなく、トレーニングデータに対して計算された値に対応して、検証/テストデータセットを中央に配置し、正規化する必要があります。これは一般的に正しいですか？

training-data - 一般化を促進するためにデータを中心化/正規化するのはいつですか?

0 に答える 0

Related

Reference