machine-learning - ANN をトレーニングするとき、検証データはどこに行きますか?

Question

トレーニングセットの一部を検証データとして使用する必要性は単純ですが、トレーニングのどの段階でどのように統合する必要があるかについてはよくわかりません。

トレーニングの最後ですか (トレーニングデータの適切な最小値に達した後) か? もしそうなら、検証データが大きなエラーをもたらす場合はどうすればよいですか?

トレーニング全体を通してですか (トレーニングデータと検証データの両方のエラーが満足のいくものではない間、最小値を探し続けます)。

何を試しても、検証セットが特定のサイズに達すると、ネットワークはトレーニングと検証の両方を学習するのに問題があるようです (70% のトレーニングと 30% の検証が一般的な比率であることをどこかで読んだことを思い出します。はるかに小さいもの)、完全にトレーニングに使用する場合、同じデータを学習しても問題ありません。

score 1 · Accepted Answer

検証データセットは、主に早期打ち切りに使用されます。

テストデータでエポックiのネットワークをトレーニングします。テストeerrorをe（t、i）とします。
検証セットでネットワークを評価します。それをe（v、i）とします。
e（v、i）> e（v、i-1）の場合、トレーニングを停止します。それ以外の場合は1に移動します。

したがって、ネットワークがオーバーフィットしたときを確認するのに役立ちます。これは、テストデータの詳細をモデル化しすぎていることを意味します。ANNを使用すると、トレーニングデータから見えないデータまで適切な一般化を実現したいという考え方です。検証セットは、トレーニングデータに特化しすぎたときにポイントに到達したときを判断するのに役立ちます。

score 1 · Accepted Answer

重要なことは、検証セットがトレーニングに関するフィードバックを持っていてはならないということです。検証セットの誤り率をプロットできますが、トレーニングアルゴリズムはトレーニングセットの誤り率を使用してそれ自体を修正することしかできません。

score 0 · Accepted Answer

0

トレーニング中に検証セットの MSE をチェックすることをお勧めします

于 2010-01-29T20:30:07.427 に答える

machine-learning - ANN をトレーニングするとき、検証データはどこに行きますか?

3 に答える 3

Related

Reference