1

VGG ネットワークから FC 層ではなく、畳み込み層の特徴を抽出するために caffe を使用しようとしています。この状況では、理論的な入力画像サイズは任意である可能性があります。しかし、VGG ネットワークは 224x224 ピクセルのサイズにトリミングされた画像でトレーニングされたようです。そこで、deploy.prototext で入力データ レイヤーを定義します。

layers{
  name: "data"
  type: MEMORY_DATA
  top: "data"
  top: "label"
  transform_param{
    mirror: false
    crop_size:224
    mean_value:129.1863
    mean_value:104.7624
    mean_value:93.5940
  }
  memory_data_param{
    batch_size:1
    channels:3
    width:224
    height:224
  }
}

width = 500\height = 500\crop_size = 500 を変更しようとしましたが、失敗しました。Caffe がいくつかのエラーをスローします。形の不一致。ソース パラメータの形状は 1 1 4096 25088 (102760448) です。ターゲット パラメータの形状は 4096 131072 (536870912) です。保存したネットからコピーするのではなく、このレイヤーのパラメーターを最初から学習するには、レイヤーの名前を変更してください。」</p>

入力レイヤーには大きすぎる画像をトリミングせずに実行するにはどうすればよいですか?

4

2 に答える 2