つまり、あなたが言及しているのは、勾配降下学習を実行するための2つのモードです。バッチモードでは、重みマトリックスへの変更は、トレーニングデータセットのプレゼンテーション全体(1つの「エポック」)にわたって累積されます。オンライントレーニングは、トレーニングセットを構成する各ベクトルの提示後に重みを更新します。
オンライントレーニングは収束がはるかに速いため、優れているというのがコンセンサスだと思います(ほとんどの研究では、精度に明らかな違いはないと報告されています)。(たとえば、Randall Wilson&Tony Martinez、最急降下法学習のためのバッチトレーニングの一般的な非効率性、ニューラルネットワーク(2003)を参照してください。
オンライントレーニングがより速く収束する理由は、各エポックにわたってエラーサーフェスの曲線をたどることができるためです。これの実際的な重要性は、より大きな学習率を使用できることです(したがって、トレーニングデータを通じてより少ないサイクルで収束します)。
言い換えると、バッチトレーニングの累積体重変化は、トレーニングセットのサイズとともに増加します。その結果、バッチトレーニングは各反復で大きなステップを使用するため、エラー空間トポロジの極小値を見逃します。ソルバーは収束するのではなく振動します。
バッチトレーニングは通常「デフォルト」(ML教科書などで最も頻繁に使用されます)であり、許容可能な制限時間内に収束する限り、それを使用しても問題はありません。繰り返しますが、パフォーマンス(解像度、または分類精度)の違いは小さいか、無視できます。