あなたからのちょっとしたアドバイスが必要です。あなたの時間があまりかからないことを願っています。
ここに私の質問があります: 私は小さな正方形の密行列を持っており、可能なサイズは 4x4、8x8、16x16 で、CUDA を使用してそれを逆にしたいと考えています。
質問の特別な部分は、このタスクを実行するために 1024 個のアイドル状態の cuda スレッドがあることです。したがって、Gauss Jordan のような最も普及している逆メソッドは、ここでは適切に機能しないのではないかと疑っています。これは、それらがわずかに並列であり、1024 の膨大な量から約 4 ~ 16 スレッドしか使用しないためです。
しかし、利用可能なすべてのスレッドを使用して、この行列を逆にするにはどうすればよいでしょうか?
ご清聴ありがとうございました!