この畳み込みの計算方法とその出力次元についていくつか質問があります。ストライド、拡張、またはパディングを使用して、nxm カーネルを使用した単純な畳み込みに精通していますが、これは問題ではありませんが、この次元は奇妙に思えます。私が使用しているモデルはonnx-mnistでよく知られているので、それが正しいと思います。
つまり、私のポイントは次のとおりです。
- 入力の次元が 1x1x28x28 の場合、出力は 1x8x28x28 になりますか?
- W はカーネルを表します。どうすれば 8x1x5x5 になるのでしょうか? 私の知る限り、最初の次元はバッチ サイズですが、ここでは 1 つの入力で推論を行っているだけです。これは理にかなっていますか?
- 私はこの畳み込み演算子をゼロから実装しています。これまでのところ、1x1x28x28 と 1x1x5x5 のカーネルで機能しますが、余分な次元は意味がありません。
私がやろうとしている畳み込みが添付されていることを確認してください。希望はあまりonnx
具体的ではありません。