3

私は時系列の温度予測に関する研究を行っていArtificial Neural NetworksますMin-Max Normalization technique. トレーニング データ セットとテスト データ セットの両方が正規化されました。入力値は、特定の日の気温、露点、降水量、気圧、および風速の値です。

テスト セットにサンプルが 1 つしかない場合 (たとえば、明日の気温を予測するために今日の天気属性しかない場合)、各属性の最小値と最大値が同じであるため、どのように値を正規化できますか?

PS 私が使用した研究の著者に既に電子メールを送信しましたが、誰も返信を送っていないので、ここで助けを求めることにしました :)

4

2 に答える 2

2

正規化はトレーニング セットとテスト セットに対して同じ方法で実行されるため、トレーニング セットの「境界」を計算し、それをテスト セットにのみ適用します (テスト データを使用してこれらの境界を計算しないでください。モデル作成の時点では、テスト データはわかりません)。

ここで機械学習の核となるアイデアが欠けているようです。1 つのサンプルで予測モデルをトレーニングすることはできません。サンプル数とは、収集した一連の観測値のサイズを意味し、モデルに供給されるデータの量ではありません (したがって、今日に基づいて明日の気温を予測する場合、サンプルが 1 つあるとは限りません。多くのサンプルが必要です。モデル、特にニューラルネットをトレーニングするための履歴からのサンプルの。

したがって、ここでは正規化の問題はそれほど重要ではありません。履歴セット全体に対して単純に行う、各属性が達成できる値の正確な境界がわかっている場合は手動で正規化できます (たとえば、温度を測定している場合)。摂氏度であるため、[-20,40] 間隔、または世界の「より柔らかい」部分に住んでいる場合はより小さな間隔に収まるはずです)。

于 2013-10-20T11:13:16.013 に答える
1

トレーニング データセットまたはテスト データセットにあるかのように、サンプルを正規化します。それらはあなたが訓練した範囲ですよね?

一般的に、限られた/部分的なデータを、処理できる/処理するように訓練したもののコンテキストに入れることが、そこから意味のある、または検証された出力を得る唯一の方法です。

そしてもちろん、単一のサンプルに完全に限定されるべきではありません..前日のサンプルの履歴を完全に保持 (および使用) できる必要があるためです。

于 2013-10-20T10:10:56.643 に答える