問題タブ [lstm]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

5741 問題

0 投票する

1 に答える

533 参照

python - LSTM をベクトル化する方法は?

特に、LSTM レイヤーが (たとえば) 50 個のセルを持つことの意味について混乱しています。このすばらしいブログ投稿の次の LSTM ブロックを検討してください。

私の入力xtが(20,)ベクトルで、隠れ層htが(50,)ベクトルだとします。セル状態が新しい隠れ状態になる前にCt点単位の操作 (点単位tanhおよび) のみを受けることを考えると、それを収集します。ここで、忘却ゲートは、隠れ層と連結された入力を調べます。これはベクトルになります。つまり、忘却ゲートはのような形状の重み行列を持たなければなりません。*Ct.shape = ht.shape = (50,)(20+50,) = (70,)(50, 70)dot(W, [xt, ht]).shape = (50,)

この時点での私の質問は、いつ 50 セルの LSTM ブロックを見ているのCt.shape = (50,)でしょうか? それとも、LSTM レイヤーに 50 個のセルがあることの意味を誤解していますか?

2015-10-23T10:51:31.127

0 投票する

1 に答える

460 参照

amazon-ec2 - Torch での LSTM のトレーニング

EC2 の Torch で LSTM モデルを実装しようとしています。

Torch の経験はありませんが、次のコードを見つけました: http://apaszke.github.io/lstm-explained.html

LSTM.lua スクリプトをロードして、EC2 で Torch を実行しています。

ガイドを読みましたが、データを追加してモデルをトレーニングする方法がわかりません。:forward と :backward をループに入れるだけですか?

amazon-ec2 neural-network torch lstm

2015-10-26T06:57:42.403

0 投票する

2 に答える

2774 参照

python - model.predict を使用した Keras 感情分類のテスト

PC で imdb_lstm.py をトレーニングしました。ここで、独自のテキストを入力して、トレーニング済みのネットワークをテストしたいと考えています。どうすればいいのですか？ありがとうございました！

python sentiment-analysis lstm keras

2015-11-05T03:30:30.077

0 投票する

1 に答える

139 参照

python - 定義されていない入力次元が原因で単純な LSTM が失敗する

ATIS データセットを分類するための LSTM モデルを構築しようとしています。

未定義のサイズ N の文から、コンテキストウィンドウの単語埋め込み行列を生成します。それが私のモデルを養うために必要なものですが、そうする方法がわかりません。

入力レイヤーを次のように定義すると:

私は得る：

l_in 宣言で入力形状を定義すると、次のように機能します。

ポイントは、各文のサイズが異なるため、コンテキストウィンドウの単語埋め込み行列の形状が異なることです。私に何ができる？

python neural-network lstm lasagne

2015-11-09T20:30:14.777

0 投票する

1 に答える

763 参照

tensorflow - 複雑な状態の予測のための Seq2Seq

私の問題:複雑な状態のシーケンスがあり、将来の状態を予測したい。

入力: 一連の状態があります。各シーケンスは可変長にすることができます。各状態は時間内の瞬間であり、いくつかの属性 [att1、att2、...] によって記述されます。各属性は、間隔 [[0..5]、[1..3651]、...] の間の数値です。

Seq2Seq の例 (および論文) は、各状態 (単語) が辞書から取得されることに基づいています。したがって、各州には約 80,000 の可能性があります。しかし、ベクトルのセットから取得された各状態をどのように表現し、そのセットが属性の可能な各組み合わせに過ぎないのでしょうか。

TensorFlow でより複雑な状態を処理する方法はありますか? また、入力の長さと出力の長さの関係が不明な場合、バケットの境界を決定する良い方法は何ですか?

tensorflow lstm

2015-11-20T14:17:46.407

0 投票する

2 に答える

578 参照

cuda - rnn cuda() を使用した LSTM?

私は次のモデルを持っています：

次に、次の方法でモデルを cuda に配置します。

入力（cudatensor）を転送しようとすると、壊れます。

FastLSTM は cuda と互換性がありませんか?

メッセージ：

cuda lstm

2015-11-21T14:38:33.837

0 投票する

0 に答える

289 参照

speech-recognition - RNN ベースの音声認識用の Theano ベースのライブラリ

RNNを使って音声認識をしようとしています。RNN ベースの音声認識に使用できる最高の theano ベースのライブラリに関する提案を得ることができれば、非常に役に立ちます。(CTC Connectionist Temporal Classification も使用したいと考えています)

speech-recognition theano lstm

2015-11-22T13:49:53.787

0 投票する

1 に答える

1866 参照

neural-network - Torch not Learning の LSTM モデル

1 つの入力と 1 つの出力を持つおもちゃのデータセットがあります。入力はランダムな 0 または 1 で、出力は前の 3 つのサンプルからの入力と同じです。

モデル 1:

モデル 2:

基準：

最初のモデルは学習せず、2 番目のモデルは機能しません (私のデータがシーケンサーにとって間違った種類である可能性があります)。

編集：

トレーニング：

トレーニングを通じてモデル 2 を実行すると、エラーが発生するようになりました。エラー

AbstractRecurrent.lua:61: gradInput がありません

オンラインで発生

lstm.modules[1]:backwardThroughTime()

neural-network torch lstm recurrent-neural-network

2015-11-23T15:58:30.763

1 2 3 4 5 6 7 8 9 10

問題タブ [lstm]

Reference