問題タブ [seq2seq]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
51 参照

machine-learning - seq2seq を使用して連結文字列をデコードする方法

以下のように連結された文字列をデコードしようとしています...

入力にはバリエーション(文字数と桁数)があるため、ハードコーディングされたルールではなく、よりスマートな方法を探しています。SEQ2SEQモデルに出会い、そのような問題でそれを使用できるかどうかを知りたいです。すでにいくつかのチュートリアルに従っていますそれを味わってください、しかし結果は近くさえありませんでした。また、このチュートリアルによると、文字レベルと単語レベルの2つのアプローチがあるようです

キャラクターレベル:

まだ単語レベルを実装しようとしていますが、このアプローチ (seq2seq) を使用して問題を解決できるかどうかを知りたいです。

0 投票する
0 に答える
305 参照

tensorflow - 多層双方向 LSTM エンコーダーをデコーダーに接続する方法は?

Bi-LSTM をエンコーダーとして使用し、デコーダーで Attention メカニズムを使用する seq2seq モデルを作成しています。LSTMモデルの単一レイヤーの場合、正常に機能しています。私のエンコーダは次のようになります。

エンコーダー:

デコーダー:

上記の単層 Bi-LSTM の構成で、私のモデルは正常に動作しています。しかし、今は多層の Bi-LSTM エンコーダーとデコーダーを使いたいと思っています。したがって、セルを次のように変更すると、エンコーダーとデコーダーで次のようになります。

セルを変更した後、次のエラーが発生します。

AttributeError: 'tuple' オブジェクトに属性 'c' がありません

ここでは、 num_layers = 2

rnn_size = 128

埋め込みサイズ= 50

stateしたがって、 2番目のケースのように正確に何が返されるかを知りたいです。そして、その状態をデコーダーに渡す方法。

完全なコード: https://github.com/sainimohit23/Text-Summarization

0 投票する
1 に答える
354 参照

tensorflow - 配置する場所seq2seq 翻訳のタグ?

私の質問に対する答えが異なる多くのチュートリアルを経験しました。

したがって、seq2seq モデル (英語からフランス語への翻訳) の場合、とタグencoder_input_dataのない英語のフレーズを持つものがあります。とと混同しています。<start><stop>decoder_input_datadecoder_target_data

現在、私のデータは、何も結果をもたらさないような方法で編成されています。

  • decoder_input_data<start>:と<stop>タグの両方を持つフランス語のフレーズが含まれています。
  • decoder_target_data<stop>:タグのみのフランス語のフレーズが含まれています。

Google からの教訓によると、英語とフランス語の両方のフレーズには、最初と最後に両方のタグが必要です。また、結果が出ません。

デコーダーの入力に<start>とタグを入れる必要がありますか? <stop>または、<start>デコーダーの入力にのみを含め<stop>、デコーダーのターゲットにタグのみを含める必要がありますか? これらのタグを NMT に配置する正しい方法は何ですか?