私の質問に対する答えが異なる多くのチュートリアルを経験しました。
したがって、seq2seq モデル (英語からフランス語への翻訳) の場合、とタグencoder_input_data
のない英語のフレーズを持つものがあります。とと混同しています。<start>
<stop>
decoder_input_data
decoder_target_data
現在、私のデータは、何も結果をもたらさないような方法で編成されています。
decoder_input_data
<start>
:と<stop>
タグの両方を持つフランス語のフレーズが含まれています。decoder_target_data
<stop>
:タグのみのフランス語のフレーズが含まれています。
Google からの教訓によると、英語とフランス語の両方のフレーズには、最初と最後に両方のタグが必要です。また、結果が出ません。
デコーダーの入力に
<start>
とタグを入れる必要がありますか?<stop>
または、<start>
デコーダーの入力にのみを含め<stop>
、デコーダーのターゲットにタグのみを含める必要がありますか? これらのタグを NMT に配置する正しい方法は何ですか?