画像の 2 チャネルで動作する GAN を開発しています。ネットワークには、0 ~ 1 の範囲で再スケーリングされたイメージ レイヤー データが供給されます。
大まかに以下のように構成されています(グラフ表現がありません、ごめんなさい)
concatenate(multiply(noise_a, l_channel), multiply(noise_b, l_channel))
- nx (
(Conv2D with relu activation)
+batchnorm
)
ステップ1は、次のconv2Dステップに供給される2つのレイヤーを生成します
入力として渡されるすべてのもの (ノイズ、画像チャネル) が 0 ~ 1 の範囲で再スケーリングされることを確認しましたが、ネットワークの出力は膨大な値を生成します (-128 -> 1000+ の範囲)。
出力は 0 ~ 1 の範囲になると予想されます (後で -128、+127 の範囲で再スケーリングされます)。
質問
- 出力範囲が 0 ~ 1 であるという仮定は間違っていますか?
- これを実現するために他に何を確認または修正する必要があるか教えていただけますか?
どんな助けでも大歓迎です。ありがとうございました