H2Oパッケージに次のように記載されていることに気付きました。
活性化関数との互換性のために標準化されるデータを前処理します (表 1 の各活性化関数のターゲット空間の要約を思い出してください)。活性化関数は通常、実数 R の全範囲にマッピングされないため、まず N (0, 1) から抽出されるデータを標準化します。ネットワーク伝播後に再度標準化すると、生の特徴空間ではなく、この標準化された空間でより正確な誤差を計算できます。自動エンコードの場合、データは (標準化ではなく) mathcalU(−0.5, 0.5) のコンパクトな間隔に正規化され、Tanh のような有界活性化関数がデータをより適切に再構築できるようになります。
しかし、私は完全には理解していません。私の印象は (こことここ)、カテゴリ変数を 1-of-C ダミーに分割し、連続データを正規化する必要があるというものでした。次に、すべてを [-1,1] に標準化する必要があります。
また、読み出しレイヤーのニューロンを指定する方法もわかりません。カテゴリカル出力変数がある場合は、softmax アクティベーション関数を使用 (および 1-of-C としてエンコード) したい /連続出力 (価格など) がある場合は、それを [-1,1] にスケーリングすると考えました。 'tanh' を使用します。単一のバイナリ出力がある場合は、ロジスティックを使用して [0,1] としてコーディングできます。