1

トレーニング セットの一部を検証データとして使用する必要性は単純ですが、トレーニングのどの段階でどのように統合する必要があるかについてはよくわかりません。

トレーニングの最後ですか (トレーニング データの適切な最小値に達した後) か? もしそうなら、検証データが大きなエラーをもたらす場合はどうすればよいですか?

トレーニング全体を通してですか (トレーニング データと検証データの両方のエラーが満足のいくものではない間、最小値を探し続けます)。

何を試しても、検証セットが特定のサイズに達すると、ネットワークはトレーニングと検証の両方を学習するのに問題があるようです (70% のトレーニングと 30% の検証が一般的な比率であることをどこかで読んだことを思い出します。はるかに小さいもの)、完全にトレーニングに使用する場合、同じデータを学習しても問題ありません。

4

3 に答える 3

1

検証データセットは、主に早期打ち切りに使用されます。

  1. テストデータでエポックiのネットワークをトレーニングします。テストeerrorをe(t、i)とします。
  2. 検証セットでネットワークを評価します。それをe(v、i)とします。
  3. e(v、i)> e(v、i-1)の場合、トレーニングを停止します。それ以外の場合は1に移動します。

したがって、ネットワークがオーバーフィットしたときを確認するのに役立ちます。これは、テストデータの詳細をモデル化しすぎていることを意味します。ANNを使用すると、トレーニングデータから見えないデータまで適切な一般化を実現したいという考え方です。検証セットは、トレーニングデータに特化しすぎたときにポイントに到達したときを判断するのに役立ちます。

于 2010-01-28T09:46:10.567 に答える
1

重要なことは、検証セットがトレーニングに関するフィードバックを持っていてはならないということです。検証セットの誤り率をプロットできますが、トレーニング アルゴリズムはトレーニング セットの誤り率を使用してそれ自体を修正することしかできません。

于 2010-01-27T18:17:08.003 に答える
0

トレーニング中に検証セットの MSE をチェックすることをお勧めます

于 2010-01-29T20:30:07.427 に答える