- 4 層の RBM を使用して DBN を作成しています。(各レイヤーには 21 個のノードがあります)
- 最後のレイヤーでは、ラベル データ、具体的には 2 つのクラスを追加しています (この DBN はバイナリ分類子です。クラス ラベル データを追加した後、最上位レイヤーに 21+2=23 ノードがあります)。
- 最後のレイヤーの出力をクラス ラベル入力と組み合わせて、2 セルのベクトルにソフトマックスしています (位置 0 の 1 はクラス 0 を示し、位置 1 の 1 はクラス 1 を示します)。
質問 - 1. CD-k を使用して、このソフトマックス層をトレーニングする必要がありますか? つまり、出力層と最後の (拡張された) 層の間で CD を作成する必要がありますか?
層から出力層への最後の接続の重みをどのように初期化しますか?
あるいは、下層に対して CD-k を使用して 21+2 ユニットの最上層をトレーニングする必要がありますか?
ありがとう。私はこの論文を見ています - http://machinelearning.org/archive/icml2008/papers/601.pdf