1

同じ計算 (たとえば、 の固有値を取得するA1, A2, ...)を行うon many(>10^15)必要があるため、できるだけ多くのスレッドを使用したいと考えています。

しかし、スレッド数を示す cuBLAS または cuSOLVER コードは見つかりませんでした。for ループと cuSOLVER 関数を使用してコードを記述した場合、cuSOLVER は自動的にリソースを分配し、計算を並列化しますか?
または、スレッド数を制御して関数を並列化できる cuSOLVER または cuBLAS API はありますか? ……

4

1 に答える 1