VGG と AlexNet などでは、正方形の寸法 ( H
== W
) の固定画像入力が必要です。非正方形の入力を提供できるように、どのように微調整またはネット手術を実行できますか?
参考までに、私は Caffe を使用してFC7
おり、非正方形の画像入力の特徴を抽出するつもりです。
VGG と AlexNet などでは、正方形の寸法 ( H
== W
) の固定画像入力が必要です。非正方形の入力を提供できるように、どのように微調整またはネット手術を実行できますか?
参考までに、私は Caffe を使用してFC7
おり、非正方形の画像入力の特徴を抽出するつもりです。
ネットの畳み込み部分の場合、入力サイズは実際には問題ではありません。入力サイズを変更すると、出力の形状が変化します。
ただし、"InnerProduct"
レイヤーに関しては、ウェイトの形状は固定されており、入力サイズによって決定されます。
レイヤーをレイヤーに変換する「ネット手術」を実行できます。このようにして、ネットは任意のサイズの入力を処理できます。ただし、出力の形状も異なります。"InnerProduct"
"Convolution"
別のオプションは、新しい固定入力サイズに従ってネットを定義し、学習した畳み込みの重みをすべて再利用し、完全に接続されたレイヤーの重みのみを微調整することです。