0

私は、とりわけ Magma 関数 magma_dgeqrf2_gpu を使用して QR 因数分解を実行するカーネルを構築しています。これにより、上三角行列 R が GPU デバイス上の一般行列 d_A に出力されます。

d_A をホストに転送せずに (さらなる操作に GPU が必要なため)、デバイス上で d_A を上三角行列 R に縮小または抽出する lib 方法はありますか?

4

1 に答える 1