下の図では、目的の出力(赤い線)を生成することを学習しようとしている学習アルゴリズムを見ることができます。学習アルゴリズムは、後方エラー伝播ニューラルネットワークに似ています。
「学習率」は、トレーニングプロセス中に行われる調整のサイズを制御する値です。学習率が高すぎる場合、アルゴリズムは迅速に学習しますが、その予測はトレーニングプロセス中に大きくジャンプします(緑色の線-学習率0.001)。低い場合、予測のジャンプは少なくなりますが、アルゴリズムは学習時間がはるかに長くなります(青い線-学習率0.0001)。
黒い線は移動平均です。
学習率を調整して、最初は目的の出力に近づくように収束させ、その後、正しい値に焦点を合わせることができるように速度を落とすにはどうすればよいですか?
学習率グラフhttp://img.skitch.com/20090605-pqpkse1yr1e5r869y6eehmpsym.png