私は多層ニューラルネットワークを扱っています。ミニバッチ勾配降下を行うつもりです。100 万を超えるデータ ポイントの 100 のミニバッチがあるとします。ネットワーク全体の重みを更新しなければならない部分がわかりません。これらの 100 個のサンプルに対してフォワード パスを実行すると、これらの 100 個のサンプルのすべてのエラーが合計されます。これ以外に何をすればいいですか?隠れ層のエラーも並べて計算する必要がありますか? それらはいつ計算されますか?
1918 次
私は多層ニューラルネットワークを扱っています。ミニバッチ勾配降下を行うつもりです。100 万を超えるデータ ポイントの 100 のミニバッチがあるとします。ネットワーク全体の重みを更新しなければならない部分がわかりません。これらの 100 個のサンプルに対してフォワード パスを実行すると、これらの 100 個のサンプルのすべてのエラーが合計されます。これ以外に何をすればいいですか?隠れ層のエラーも並べて計算する必要がありますか? それらはいつ計算されますか?