2

ラザニアを使用して、いくつかの画像でニューラル ネットワークを使用してバイナリ分類器を構築しようとしています。トレーニングと検証の損失は大きく変動し (安定しません)、検証の精度は常に0%です。さらに、ネットワークは常に1テスト セットと同様にターゲットを予測します。

私が使用しているネットワークは、基本的にここにある mnist データセットのラザニアの例のコピーにすぎませんが、トレーニング セット内の509 x 115周囲の画像を含む、かなり大きい ( ) 私の画像に適合しています400。これが問題なのか、ネットワークをより深くする必要があるのか​​、ニューロンを増やす必要があるのか​​ どうか疑問に思っていますか?

このサイズの画像には、より大きなトレーニング セットが必要ですか? それとも、不正確ではありますが、テスト セットの一連の予測を表示する必要がありますか?

4

1 に答える 1

4

画像のサイズを小さいものに変更します。トレーニングの例が非常に限られているため、簡単にオーバーフィットする大きなモデルをトレーニングしたくないでしょう。

次のトリックも役立つ場合があります。

  • 画像が平均値を差し引かれているかどうかを確認してください。入力値が [0,255] の間の生のピクセルである場合、それは大きすぎます。

  • さまざまな学習率を試してください。結果が変動する場合は、学習率が高すぎる可能性があります。

  • データ拡張を使用します。画像を反転したり、上下左右に数ピクセル移動したりできます。その後、さらに多くのトレーニング例を取得できます。

  • トレーニングセットを見てください。モデルがどこで間違いを犯したかを確認します。トレーニング エラーが悪い場合は、何か問題があるはずです。

于 2015-09-11T04:11:06.493 に答える