python - STN: 空間トランスフォーマーネットワーク: 画像の回転と移動

Question

CNN は次のとおりです。

outLayer = Layers.Dense(3 * 2、activation=activations.linear、kernel_initializer="zeos"、bias_initializer=output_bias)(d2)

私の後：

input1 の変換と回転のためにSTN ( https://github.com/kevinzakka/spatial-transformer-network ) を追加します。完全なネットワークは、STN を使用した CNN です。32 バッチで画像 (128x128) を返す
私の損失は、入力 2 と出力 (CNN) の間の MSE です: ターゲットエラー登録。2 つの画像 (input2 と output) 間の MSE

input2 = output であるため、ネットワークは変換行列を見つけなければなりません。val_loss に問題があるため (tensorflow を使用):

エポック 1/90 30/30 [=============================] - 81 秒 3 秒/ステップ - 損失: 16.0190 - val_loss : 24.3248

エポック 2/90 30/30 [============================] - 79 秒 3 秒/ステップ - 損失: 13.9868 - val_loss : 21.4465

エポック 3/90 30/30 [============================] - 73 秒 2 秒/ステップ - 損失: 13.2970 - val_loss : 21.3151

エポック 4/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 12.9244 - val_loss : 21.6154

エポック 5/90 30/30 [============================] - 67 秒 2 秒/ステップ - 損失: 12.6868 - val_loss : 20.0113

エポック 6/90 30/30 [=============================] - 66 秒 2 秒/ステップ - 損失: 12.4998 - val_loss : 20.8911

エポック 7/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 12.3066 - val_loss : 21.4276

エポック 8/90 30/30 [=============================] - 67 秒 2 秒/ステップ - 損失: 12.1034 - val_loss : 21.3593

エポック 9/90 30/30 [=============================] - 69 秒 2 秒/ステップ - 損失: 11.7645 - val_loss : 20.8941

エポック 10/90 30/30 [=============================] - 67 秒 2 秒/ステップ - 損失: 11.6544 - val_loss : 20.4768

エポック 11/90 30/30 [=============================] - 70 秒 2 秒/ステップ - 損失: 11.5483 - val_loss : 21.7420

エポック 12/90 30/30 [=============================] - 68 秒 2 秒/ステップ - 損失: 11.5680 - val_loss : 19.4531

python - STN: 空間トランスフォーマー ネットワーク: 画像の回転と移動