問題タブ [sequence-to-sequence]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
235 参照

python - 双方向lstmを使用したテンソルフローのシーケンスタグ付けタスク

NER の配列タグ付けにはあまり興味がありません。コード「https://github.com/monikkinom/ner-lstm/blob/master/model.py」に従って、モデルを以下のようにします。

入力は、
X: (batch_size,max_sent_length,word_embed_dim)
および
Y: (batch_size,max_sent_length,number_of_labels) です。

次に、値を双方向 LSTM ユニットに渡します。

ここで、rnn_size = 128

次に、以下の計算を行っています。

私は、batch_size = 64 と 30 エポックを取りました。
しかし、私のモデルでは、毎回 1 つのラベルしか検出されません。私のコードで問題を指摘することはできません。助けてください。

0 投票する
1 に答える
752 参照

python - 2 つの Sequence to Sequence モデル keras の違い (RepeatVector を使用する場合と使用しない場合)

私は、このモデルの違いがここで説明されていることを理解しようとしています。次のモデルです。

ここで説明するシーケンスからシーケンスへのモデルは 2 番目の説明です

違いはなんですか ?最初のものには RepeatVector がありますが、2 番目にはそれがありませんか? 最初のモデルは、デコーダの隠れ状態を予測の初期状態として使用していませんか?

1 番目と 2 番目のものについて説明している論文はありますか?

0 投票する
0 に答える
308 参照

node.js - tensorflow.js でシーケンス 2 シーケンス モデルを構築してトレーニングする方法

こんにちは、tensorflow.js でシーケンス 2 シーケンス モデルを使用して、テキスト サマライザーを構築しようとしています。

私のデータセット(例):

事前トレーニング済みの word2vec モデルを使用して、テキストを単語ベクトルに変換できます。これらの単語埋め込みを LSTM ネットワークに使用して、センチメント値を取得しています。

理論的にはシーケンス 2 シーケンス モデルの感覚を得ることができましたが、コーディングの観点から、エンコーダー/デコーダー ネットワークが実際のコードとしてどのように見えるかについて、この考えに頭を悩ませることができませんでした。

tensorflow.js のエンコーダーとデコーダー ネットワークの単純で単純な例を投稿してください。

または、すでにいくつかの例が投稿されている場合は、それらを共有してください。

0 投票する
0 に答える
65 参照

tensorflow - BahdanauAttention の num_units 引数とは何ですか?

num_unitsTensorFlow の BahdanauAttention の引数がわかりません。次のように定義されています。

num_units: クエリ メカニズムの深さ。

これは私にはわかりません。