ニューラルネットワークでのオーバーフィッティングを避けるために、早期停止方法を使用したいと考えています。データセットを 60-20-20 に分割しました
60 - トレーニング 20 - 検証セット 20 - テスト セット
早期停止を実装する際に疑問があります。
- トレーニング セットを使用して、1 エポックの重みを更新します。トレーニング セットを使用したネットワークでエラーが発生しました。
- 検証セットのエラーを計算する必要があります。各検証インスタンスのすべてのエラーを平均化する必要がありますか?? たとえば、200 個の検証インスタンスがあるとします。重みを更新していないため、各インスタンスの誤差を計算します。では、すべての検証インスタンスを平均して、それを検証エラーとして報告する必要がありますか??
ありがとう、アティッシュ