1

私の質問に対する答えが異なる多くのチュートリアルを経験しました。

したがって、seq2seq モデル (英語からフランス語への翻訳) の場合、とタグencoder_input_dataのない英語のフレーズを持つものがあります。とと混同しています。<start><stop>decoder_input_datadecoder_target_data

現在、私のデータは、何も結果をもたらさないような方法で編成されています。

  • decoder_input_data<start>:と<stop>タグの両方を持つフランス語のフレーズが含まれています。
  • decoder_target_data<stop>:タグのみのフランス語のフレーズが含まれています。

Google からの教訓によると、英語とフランス語の両方のフレーズには、最初と最後に両方のタグが必要です。また、結果が出ません。

デコーダーの入力に<start>とタグを入れる必要がありますか? <stop>または、<start>デコーダーの入力にのみを含め<stop>、デコーダーのターゲットにタグのみを含める必要がありますか? これらのタグを NMT に配置する正しい方法は何ですか?

4

1 に答える 1