Deep Belief Network の「教師なし事前トレーニング」後に得られる各層の重み/コストは、ドロップアウトが適用されている場合と適用されていない場合で異なりますか?
ドロップアウトを適用して、または適用せずに DBN を事前トレーニングした後、さまざまな重みのセットとさまざまなコストの値を取得しました。私によると、ユニットのドロップアウトは微調整段階にのみ影響し、すべてのユニットが必要で何もドロップされない教師なし事前トレーニングには影響しません。コンセプトが間違っているか、コードが間違っていますか?