CNN は次のとおりです。
- input: 2 画像 128x128: input1 と input2
- 出力: CNN は変換行列を返します:
outLayer = Layers.Dense(3 * 2、activation=activations.linear、kernel_initializer="zeos"、bias_initializer=output_bias)(d2)
私の後:
- input1 の変換と回転のためにSTN ( https://github.com/kevinzakka/spatial-transformer-network ) を追加します。完全なネットワークは、STN を使用した CNN です。32 バッチで画像 (128x128) を返す
- 私の損失は、入力 2 と出力 (CNN) の間の MSE です: ターゲット エラー登録。2 つの画像 (input2 と output) 間の MSE
input2 = output であるため、ネットワークは変換行列を見つけなければなりません。val_loss に問題があるため (tensorflow を使用):
エポック 1/90 30/30 [=============================] - 81 秒 3 秒/ステップ - 損失: 16.0190 - val_loss : 24.3248
エポック 2/90 30/30 [============================] - 79 秒 3 秒/ステップ - 損失: 13.9868 - val_loss : 21.4465
エポック 3/90 30/30 [============================] - 73 秒 2 秒/ステップ - 損失: 13.2970 - val_loss : 21.3151
エポック 4/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 12.9244 - val_loss : 21.6154
エポック 5/90 30/30 [============================] - 67 秒 2 秒/ステップ - 損失: 12.6868 - val_loss : 20.0113
エポック 6/90 30/30 [=============================] - 66 秒 2 秒/ステップ - 損失: 12.4998 - val_loss : 20.8911
エポック 7/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 12.3066 - val_loss : 21.4276
エポック 8/90 30/30 [=============================] - 67 秒 2 秒/ステップ - 損失: 12.1034 - val_loss : 21.3593
エポック 9/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 11.7645 - val_loss : 20.8941
エポック 10/90 30/30 [=============================] - 67 秒 2 秒/ステップ - 損失: 11.6544 - val_loss : 20.4768
エポック 11/90 30/30 [=============================] - 70 秒 2 秒/ステップ - 損失: 11.5483 - val_loss : 21.7420
エポック 12/90 30/30 [=============================] - 68 秒 2 秒/ステップ - 損失: 11.5680 - val_loss : 19.4531