3

特に、LSTM レイヤーが (たとえば) 50 個のセルを持つことの意味について混乱しています。このすばらしいブログ投稿の次の LSTM ブロックを検討してください。

http://colah.github.io/posts/2015-08-Understanding-LSTMs/ の LSTM モデル

私の入力xt(20,)ベクトルで、隠れ層ht(50,)ベクトルだとします。セル状態が新しい隠れ状態になる前にCt点単位の操作 (点単位tanhおよび) のみを受けることを考えると、それを収集します。ここで、忘却ゲートは、隠れ層と連結された入力を調べます。これはベクトルになります。つまり、忘却ゲートは のような形状の重み行列を持たなければなりません。*Ct.shape = ht.shape = (50,)(20+50,) = (70,)(50, 70)dot(W, [xt, ht]).shape = (50,)

この時点での私の質問は、いつ 50 セルの LSTM ブロックを見ているのCt.shape = (50,)でしょうか? それとも、LSTM レイヤーに 50 個のセルがあることの意味を誤解していますか?

4

1 に答える 1