1

さて、私はニューラルネットワークの考え方を理解し始めていますが、特に画像処理のための畳み込みニューラルネットワークの使用/利点/実装をまだ理解できていません.

私が理解していないのは、異なるサイズのオブジェクトを検出する方法です。

50*50 の重み行列と、50*50 サイズのトレーニング セットに顔があるとします。行列の加重合計を取ると、 "X" などの特定の値が返されます。これで、画像全体に重み行列を実行して、顔を検出した ~"X" の重み付き合計を与える領域をロックするというアイデアを理解しました。

上記の理解が正しい場合、サイズ 25*25 のイメージが "X" のどこにでも値を複製することはどのように行われるのでしょうか。したがって、基本的な問題は、画像の相対的なサイズをどのように処理するかです。

可能であれば、同じための優れたチュートリアルをいくつか提案してください。

4

1 に答える 1