独自の LSTM (長期短期記憶) ニューラル ネットワークをプログラムしようとしました。基本的な機能が動作していることを確認したいと思います。時間 BPTT アルゴリズムによる逆伝播を実装して、単一のセル ネットワークをトレーニングしました。
単一セルの LSTM ネットワークは単純なシーケンスを学習できるべきですか、それとも複数のセルが必要ですか? ネットワークは、1 0 0 0 1 0 0 0 1 0 0 0 1 などの単純なシーケンスを学習できないようです。
シーケンス 1 と 0 を 1 つずつ順番にネットワークに送信し、それをフィードします。シーケンスの各出力を記録します。
LSTM セルを介してシーケンス全体を実行した後、平均誤差信号をセルに戻し、重みの変更をセル内部の別のコレクションに保存し、すべてのエラーを 1 つずつ実行して新しい重みを計算した後、各エラーの後、セル内の各重みについて、新しい重みを平均して新しい重みを取得します。
私は何か間違ったことをしていますか?アドバイスをいただければ幸いです。
どうもありがとう!