問題タブ [seq2seq]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

281 問題

0 投票する

3 に答える

6565 参照

deep-learning - バッチマトリックスマトリックス製品を行うのはなぜですか?

私はPytorch seq2seq チュートリアルに従っており、そのtorch.bmmメソッドは以下のように使用されます:

注意の重みとエンコーダーの出力を乗算する必要がある理由を理解しています。

bmm私がよく理解していないのは、ここでメソッドが必要な理由です。torch.bmm文書によると

バッチ 1 とバッチ 2 に格納されている行列のバッチ行列行列積を実行します。

batch1 と batch2 は、それぞれが同じ数の行列を含む 3 次元テンソルでなければなりません。

batch1 が (b×n×m) テンソル、batch2 が (b×m×p) テンソルの場合、out は (b×n×p) テンソルになります。