Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私は、とりわけ Magma 関数 magma_dgeqrf2_gpu を使用して QR 因数分解を実行するカーネルを構築しています。これにより、上三角行列 R が GPU デバイス上の一般行列 d_A に出力されます。
d_A をホストに転送せずに (さらなる操作に GPU が必要なため)、デバイス上で d_A を上三角行列 R に縮小または抽出する lib 方法はありますか?