特定の条件が満たされた後に学習率を変更する価値はありますか? そして、どのように、そしてなぜそれをするのですか?たとえば、ネットは高い学習率で開始し、二乗誤差が十分に低くなると、精度を高めるために学習率が低下するか、学習率が局所的最小値から飛び出すまで増加する必要がありますか? オーバーフィッティングの原因になりませんか?そして、勢いはどうですか?
特定の条件が満たされた後に学習率を変更する価値はありますか? そして、どのように、そしてなぜそれをするのですか?たとえば、ネットは高い学習率で開始し、二乗誤差が十分に低くなると、精度を高めるために学習率が低下するか、学習率が局所的最小値から飛び出すまで増加する必要がありますか? オーバーフィッティングの原因になりませんか?そして、勢いはどうですか?