neural-network - Caffe: vgg ネットワークの可変入力画像サイズ

翻译自：https://stackoverflow.com/questions/40530162 2016-11-10T14:35:51.620

1247 次

VGG ネットワークから FC 層ではなく、畳み込み層の特徴を抽出するために caffe を使用しようとしています。この状況では、理論的な入力画像サイズは任意である可能性があります。しかし、VGG ネットワークは 224x224 ピクセルのサイズにトリミングされた画像でトレーニングされたようです。そこで、deploy.prototext で入力データレイヤーを定義します。

layers{
  name: "data"
  type: MEMORY_DATA
  top: "data"
  top: "label"
  transform_param{
    mirror: false
    crop_size:224
    mean_value:129.1863
    mean_value:104.7624
    mean_value:93.5940
  }
  memory_data_param{
    batch_size:1
    channels:3
    width:224
    height:224
  }
}

width = 500\height = 500\crop_size = 500 を変更しようとしましたが、失敗しました。Caffe がいくつかのエラーをスローします。形の不一致。ソースパラメータの形状は 1 1 4096 25088 (102760448) です。ターゲットパラメータの形状は 4096 131072 (536870912) です。保存したネットからコピーするのではなく、このレイヤーのパラメーターを最初から学習するには、レイヤーの名前を変更してください。」</p>

入力レイヤーには大きすぎる画像をトリミングせずに実行するにはどうすればよいですか?

neural-network - Caffe: vgg ネットワークの可変入力画像サイズ

2 に答える 2

Related

Reference