新しい重みの初期化方法を開発しようとしていますが、奇妙なトレーニング現象が発生しています。出力ノード 8 が最大アクティベーションではないことがわかります...
tansig アクティベーション、mse パフォーマンス、およびバイアス ノードなしで matlab patternnet を使用しています。mnist データベースのサブセットを分類しようとしています。
これをトラブルシューティングする方法を知っている人はいますか? nguyen-widrow の初期化を使用しても、同じアーキテクチャを使用しているにもかかわらず、この結果は表示されません。
編集:
入力: 768xN の 0 ~ 1 の値
ターゲット: それぞれの行ごとに 0 または 1 の値の 10xN。つまり、列ごとに 1 つの true を持つロジック マトリックスのようなものです。
1 つ以上のノードがアクティブ化されません。最良のケースを示しました。
これは、1 つ以上のレイヤー (1 から 5)、少ないまたは多いトレーニング データ (1k から 10k サンプル) で発生します。