このKeras conv_filter_visualizationの例は、VGG-16 ネットワークのレイヤー 5 の視覚化された重みの 8x8 グリッドを出力します。コードは 512 個のフィルターのうち 128 個を通過し、最大の損失を与えるフィルターの重みを視覚化します。出力例はこちら。
グリッドの各セルのサイズが 128x128 ピクセルなのはなぜですか?
VGG のレイヤ 5 には、3 つの 512x3x3 フィルタがあります。
ブロック 5
x = Convolution2D(512, 3, 3, activation='relu', border_mode='same', name='block5_conv1')(x)
x = Convolution2D(512, 3, 3, activation='relu', border_mode='same', name='block5_conv2')(x)
x = Convolution2D(512, 3, 3, activation='relu', border_mode='same', name='block5_conv3')(x)
x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool')(x)`
これらが 128x128 ピクセルのセルとして視覚化される方法について混乱しています。