バックプロパゲーション トレーニングでは、誤差曲面を下る勾配降下中に、隠れ層に大量のニューロンを含むネットワークが局所的最小値でスタックする可能性があります。すべての場合に重みを乱数に再初期化すると、最終的にこの問題が回避されることを読みました。これは、「正しい」初期重み値のセットが常に存在することを意味します。(これは想定しても安全ですか?)
それらを見つけるアルゴリズムを見つけるか、作成する必要があります。
私はアルゴリズムをグーグルで調べてみましたが、自分で考案しようとしましたが、役に立ちませんでした。誰でも解決策を提案できますか? おそらく私が検索できるアルゴリズムの名前ですか?
注:これは通常のフィードフォワード3層ブリトーです:)
注: その目的で GA を使用する試みが行われたことは知っていますが、ネットワークが十分に大きくなると、反復ごとにネットワークを再トレーニングする必要があり、時間がかかります。
前もって感謝します。