2

新しい重みの初期化方法を開発しようとしていますが、奇妙なトレーニング現象が発生しています。出力ノード 8 が最大アクティベーションではないことがわかります... ここに画像の説明を入力

tansig アクティベーション、mse パフォーマンス、およびバイアス ノードなしで matlab patternnet を使用しています。mnist データベースのサブセットを分類しようとしています。

これをトラブルシューティングする方法を知っている人はいますか? nguyen-widrow の初期化を使用しても、同じアーキテクチャを使用しているにもかかわらず、この結果は表示されません。

編集:

入力: 768xN の 0 ~ 1 の値

ターゲット: それぞれの行ごとに 0 または 1 の値の 10xN。つまり、列ごとに 1 つの true を持つロジック マトリックスのようなものです。

1 つ以上のノードがアクティブ化されません。最良のケースを示しました。

これは、1 つ以上のレイヤー (1 から 5)、少ないまたは多いトレーニング データ (1k から 10k サンプル) で発生します。

4

1 に答える 1

1

問題の解決策を見つけたと思います。

伝達関数の重要な領域 (-1 から 1) に沿ってのみ重みをスケーリングすることで、この現象は見られなくなりました。

于 2012-11-04T00:59:37.470 に答える