2

畳み込みニューラル ネットでのデコンボリューションまたは後方畳み込みとはどういう意味ですか?

畳み込みを理解しています。3x3 ウィンドウ W と同じサイズのカーネル k を考慮すると、畳み込み W*K の結果は 1 つの値になります。ここで、k は 3x3 要素の行列です。

私の理解では、デコンボリューションは、特徴マップをアップサンプリングしてより大きなマップを取得しようとしています。特徴マップを取得するために使用されるのと同じ畳み込み行列を使用しますか? そうでない場合、バックプロパゲーションの勾配を計算する方法は? 詳細な説明は非常に役立ちます。

4

2 に答える 2

3

詳細な説明は、StackOverflow の範囲をはるかに超えています。これはチュートリアル サイトではありません。

一般に、デコンボリューションは逆畳み込みに近いものです。各ピクセルは、抽出元の 3x3 領域に影響を与え、フィルターのフーリエ変換を適用して入力パラメーターをリバース エンジニアリングします。信号処理でノイズを減らしたり、特徴を鮮明にしたりするためによく使用されます。

たとえば、多かれ少なかれ二次曲線に沿って分布する xy 平面の 12 個のデータ ポイントを視覚化します。4 次方程式 (またはローリング キュービックの組み合わせ) を特定の点にマッピングするためのさまざまな最適な方法があります。これは一種のデコンボリューションです。

ここにいくつかの参考文献があります; そのうちの 1 つまたは 2 つが、あなたが前進するために必要なレベルにあることを願っています。

https://en.wikipedia.org/wiki/Deconvolution

https://www.reddit.com/r/MachineLearning/comments/454ksm/tutorial_on_deconvolution/

https://github.com/tensorflow/tensorflow/issues/2169#issuecomment-216607417

于 2016-07-08T17:55:32.733 に答える