1

各層に入っているニューロンの数を教えてください。これにより、VGG で何が起こっているかについての理解が深まると思います。

ここでこのコードを使用して、具体的なものを用意しましょう。

https://github.com/machrisaa/tensorflow-vgg/blob/master/vgg19.py#L46

この行では、224x224x3 (画像) が入力されているのがわかります。コードの各行 (各行はレイヤーを表します) の後、この画像の寸法はどうなりますか?

ありがとうございました。

4

2 に答える 2

2

投稿したデバッグ情報は、各 op/layer の出力のディメンションです。それは「ニューロン」の数に関連していますが、同じではありません。

出力ディメンションはどこから取得されますか?

VGG-19 には 2 種類のレイヤーしかありません (softmax と完全接続を除く)。

  • 畳み込みレイヤー:それらはすべてストライド 1 とパディング 1 の 3x3 フィルターを使用します。これは、出力ボリュームが入力ボリュームと同じ幅と高さ (およびフィルターの数に等しい深さ) を持つことを意味します。以下のリファレンスのスライド 44 には、入力次元と畳み込みパラメーターを指定して出力を計算するための式が含まれています。
  • 最大プール レイヤー:すべてストライド 2 の 2x2 ウィンドウを使用します。これは、出力ボリュームが入力ボリュームの半分の幅と半分の高さを持つことを意味します。スライド 56。

ニューロンはどこにありますか?

ネットワークをニューロンの集合として解釈したいとしましょう。ニューロンは、その入力の加重合計を収集し、非線形で変換するために使用する一連の重みを持つ各ユニットです。

まず、全結合層にニューロンがあります: 4096 + 4096 + 1000 = 9192 ニューロン。

次に、畳み込み層にニューロンがあります。基本的に、各フィルターを 1 つのニューロンとして見ることができます (スライド 50 に素敵な図があります)。

スライド 71 の各レイヤーのフィルター数を簡単に調べることができます (たとえば、conv3-64 は 64 個の 3x3 フィルターを表します)。VGG-19 の場合、2*64 + 2*128 + 4*256 + 2*4*512 = 5504 個のニューロンがあります。

以上のことから、実際には、通常、ネットワークのサイズは、パラメーターの数 (つまり、重み) と層の数で測定されます。VGG-19 には 1 億 4400 万のパラメータがあり、非常に大きいです。比較のために、トレーニング セットには 130 万のサンプルがあります。

参考:http ://cs231n.stanford.edu/slides/winter1516_lecture7.pdf

于 2016-11-03T07:48:23.347 に答える
0

コードを計測する方法を見つけ、各レイヤーのサイズを取得しました。これにより、今では多くの明確さが得られます。興味があれば、テンソルフローのインタラクティブ セッション機能を使用してこれを実行しました。

conv1_1 [100, 224, 224, 64]

conv1_2 [100、224、224、64]

プール1 [100、112、112、64]

conv2_1 [100, 112, 112, 128]

conv2_2 [100、112、112、128]

プール 2 [100、56、56、128]

conv3_1 [100, 56, 56, 256]

conv3_2 [100、56、56、256]

conv3_3 [100、56、56、256]

conv3_4 [100, 56, 56, 256]

プール3 [100、28、28、256]

conv4_1 [100、28、28、512]

conv4_2 [100、28、28、512]

conv4_3 [100、28、28、512]

conv4_4 [100、28、28、512]

プール 4 [100、14、14、512]

conv5_1 [100、14、14、512]

conv5_2 [100、14、14、512]

conv5_3 [100、14、14、512]

conv5_4 [100、14、14、512]

プール 5 [100、7、7、512]

fc6 [100、4096]

relu6 [100, 4096]

fc7 [100、4096]

relu7 [100, 4096]

fc8 [100、1000]

確率 [100, 1000]

于 2016-11-03T05:12:25.873 に答える