deep-learning - バッチマトリックスマトリックス製品を行うのはなぜですか?

質問する 2018-06-12T22:23:41.557

6565 次

私はPytorch seq2seq チュートリアルに従っており、そのtorch.bmmメソッドは以下のように使用されます:

attn_applied = torch.bmm(attn_weights.unsqueeze(0),
                         encoder_outputs.unsqueeze(0))

注意の重みとエンコーダーの出力を乗算する必要がある理由を理解しています。

bmm私がよく理解していないのは、ここでメソッドが必要な理由です。torch.bmm文書によると

バッチ 1 とバッチ 2 に格納されている行列のバッチ行列行列積を実行します。

batch1 と batch2 は、それぞれが同じ数の行列を含む 3 次元テンソルでなければなりません。

batch1 が (b×n×m) テンソル、batch2 が (b×m×p) テンソルの場合、out は (b×n×p) テンソルになります。

deep-learning - バッチマトリックスマトリックス製品を行うのはなぜですか?

3 に答える 3

Related

Reference