畳み込みニューラル ネットワークに関しては、通常、さまざまな戦略を推奨する多くの論文があります。畳み込みの前に画像にパディングを追加することが絶対に必要であると人々が言うのを聞いたことがあります。そうしないと、多くの空間情報が失われます。一方、画像のサイズを縮小するために、プーリング (通常は最大プーリング) を喜んで使用します。ここでの考えは、最大プーリングは空間情報を減らしますが、相対的な位置に対する感度も低下させるので、トレードオフですか?
ゼロパディングはより多くの情報を保持するのではなく、空のデータを保持するだけだと他の人が言っているのを聞いたことがあります。これは、ゼロを追加すると、情報の一部が欠落している場合にカーネルからの反応が得られないためです。
エッジに「スクラップ値」を持つ大きなカーネルがあり、活性化のソースがカーネルの小さな領域に集中している場合、ゼロパディングが機能すると想像できますか?
パディングを使用せずにプーリング コントラを使用したダウンサンプリングの効果に関する論文をいくつか読んでみたいと思いますが、それについてはあまり見つけられません。良い推奨事項や考えはありますか?
図: 畳み込みコントラ プーリングを使用した空間ダウンサンプリング (Researchgate)