私はこの pytorch チュートリアルに従い、この原則を要約に適用しようとしています。ここで、エンコード シーケンスは約 1000 ワードで、デコーダーは 200 ワードをターゲットにします。
これはどのように申請すればよいseq2seq
ですか?1000 語のシーケンス全体を一度に実行するのは非常にコストがかかり、ほとんど実行不可能であることはわかっています。したがって、seq を 20 個の seq に分割し、並列に実行することが答えになる可能性があります。しかし、それを実装する方法がわかりません。そこにも注目したい。