0

私は、正規化された、正に歪んだ、負に歪んだ、さまざまな分布を持つ多数の機能を含むデータセットを正規化しようとしています。分類モデルを構築するための予備ステップとしてデータの正規化を実行する際、データ セット内のすべてのフィーチャに同じ正規化手法を適用する必要がありますか?それとも、データ セット内の異なるフィーチャに異なる正規化手法を適用する必要がありますか?

4

1 に答える 1

0

たぶん

画一的なルールはありません。

たとえば、小さい縮尺で x、y 座標がある場合は、同じ正規化を使用する方がおそらく適切です。「同じ方法」だけでなく、「同じスケール」でも同じです。緯度と経度がある場合は、地球が歪んでいると仮定する理由がない限り、正規化を行わないでください。また、属性 A が「靴のサイズ」であり、属性 B が「円周率 / 靴のサイズ」であるなど、スケールがまったく異なる場合、はい、これら 2 つの属性に対して異なる正規化が必要になります。

通常、この疑問が生じたとき、あなたは自分のデータをまだ理解していません。

于 2013-10-01T08:01:00.430 に答える