“recurrent-neural-network”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

2213 参照

python - model.fit の次元数が間違っています

このSimpleRNNを実行しようとしています:

以下に示すように、エラーは model.fit にあります。

エラーは、次元の数が間違っていることを示しています。3 である必要がありますが、2 しかありません。それが参照している次元は何ですか?

2016-03-21T16:27:42.973

0 投票する

1 に答える

2686 参照

python - tensorflow で双方向 RNN に可変バッチサイズを使用する方法

tensorflow は、双方向 RNN の可変バッチサイズをサポートしていないようです。この例では、は Python 整数であるにsequence_length関連付けられています。batch_size

トレーニングとテストに異なるバッチサイズを使用するにはどうすればよいですか?

python tensorflow recurrent-neural-network

2016-03-23T21:23:54.510

0 投票する

0 に答える

3117 参照

python - Tensorflow の Char-RNN

シンプルな RNN をテンソルフローで動作させようとしていますが、いくつか問題があります。

私が今やろうとしているのは、セルタイプとして LSTM を使用して RNN のフォワードパスを単純に実行することです。

いくつかのニュース記事をスクレイピングして、それらを RNN にフィードしたいと考えています。すべての記事の連結で構成される文字列を文字に分割し、文字を整数にマップしました。次に、これらの整数をワンホットエンコードしました。

次にテンソルフローコードです。データ内のすべての文字を実行し、フォワードパスごとに 25 文字を使用したいと考えています。私の最初の質問は、バッチサイズに関するものです。先ほど述べた方法でこれを実行したい場合、私のバッチサイズは 1 ですよね? したがって、入力内の 1 つの文字に対応する各ベクトルの形状は [1,vocab_size] であり、入力にはこれらのベクトルが 25 個あります。そこで、次のテンソルを使用しました。

rnn 関数が期待する形式であるため、最後のテンソルを作成する必要がありました。

次に、変数のスコープで問題が発生しました。以下のエラーが表示されます。

コードで実際に変数を指定していないため、なぜこのエラーが発生するのかわかりません。変数は rnn および rnn_cell 関数内でのみ作成されます。誰かがこのエラーを修正する方法を教えてもらえますか?

入力が tf.int32 型であるため、現在発生している別のエラーは型エラーですが、LSTM 内で作成された非表示層は tf.float32 型であり、rnn_cell.py コード内の線形関数は連結します。これらの 2 つのテンソルを計算し、それらに重み行列を掛けます。なぜこれが不可能なのでしょうか。入力がワンホットエンコードされて int32 型になるのは比較的一般的だと思います。

一般に、char-rnns のトレーニング時にバッチサイズを 1 標準にするというこのアプローチはありますか? Andrej Karpathy によるコードを見たことがあります。そこでは、彼は基本的な numpy で char-rnn をトレーニングし、同じ手順を使用します。ここでは、長さ 25 のシーケンスでテキスト全体を単純に調べます。コードは次のとおりです: https:// gist.github.com/karpathy/d4dee566867f8291f086

python tensorflow deep-learning recurrent-neural-network

2016-03-25T11:12:13.150

0 投票する

1 に答える

148 参照

theano - Theano チュートリアルの RNN のパラメーター

RNN に関する Theano チュートリアル ( http://deeplearning.net/tutorial/rnnslu.html ) に従っていますが、それについて 2 つの質問があります。初め。このチュートリアルでは、繰り返しは次のように機能します。

def recurrence(x_t, h_tm1): h_t = T.nnet.sigmoid(T.dot(x_t, self.wx) + T.dot(h_tm1, self.wh) + self.bh) s_t = T.nnet.softmax(T.dot(h_t, self.w) + self.b) return [h_t, s_t]

h_t に h0 を追加しないのはなぜですか？(つまりh_t = T.nnet.sigmoid(T.dot(x_t, self.wx) + T.dot(h_tm1, self.wh) + self.bh + self.h0))

第二に、なぜoutputs_info=[self.h0, None]ですか？outputs_info が初期化結果であることはわかっています。だから私は思うoutputs_info=[self.bh+self.h0, T.nnet.softmax(T.dot(self.bh+self.h0, self.w_h2y) + self.b_h2y)]

theano deep-learning recurrent-neural-network

2016-03-29T05:03:04.530

0 投票する

1 に答える

603 参照