LSTM ベースの音声認識エンジンを実装しようとしています。これまでのところ、マージレイヤーの例に従って、双方向 LSTM をセットアップできました (双方向 LSTM として機能していると思います)。ここで、別の双方向 LSTM レイヤーで試してみたいと思います。これにより、深い双方向 LSTM になります。しかし、以前にマージされた 2 つのレイヤーの出力を LSTM レイヤーの 2 番目のセットに接続する方法がわかりません。Kerasで可能かどうかはわかりません。誰かがこれで私を助けてくれることを願っています。
私の単層双方向LSTMのコードは次のとおりです
left = Sequential()
left.add(LSTM(output_dim=hidden_units, init='uniform', inner_init='uniform',
forget_bias_init='one', return_sequences=True, activation='tanh',
inner_activation='sigmoid', input_shape=(99, 13)))
right = Sequential()
right.add(LSTM(output_dim=hidden_units, init='uniform', inner_init='uniform',
forget_bias_init='one', return_sequences=True, activation='tanh',
inner_activation='sigmoid', input_shape=(99, 13), go_backwards=True))
model = Sequential()
model.add(Merge([left, right], mode='sum'))
model.add(TimeDistributedDense(nb_classes))
model.add(Activation('softmax'))
sgd = SGD(lr=0.1, decay=1e-5, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy', optimizer=sgd)
print("Train...")
model.fit([X_train, X_train], Y_train, batch_size=1, nb_epoch=nb_epoches, validation_data=([X_test, X_test], Y_test), verbose=1, show_accuracy=True)
私の x 値と y 値の寸法は次のとおりです。
(100, 'train sequences')
(20, 'test sequences')
('X_train shape:', (100, 99, 13))
('X_test shape:', (20, 99, 13))
('y_train shape:', (100, 99, 11))
('y_test shape:', (20, 99, 11))