同じ計算 (たとえば、 の固有値を取得するA1, A2, ...
)を行うon many(>10^15)
必要があるため、できるだけ多くのスレッドを使用したいと考えています。
しかし、スレッド数を示す cuBLAS または cuSOLVER コードは見つかりませんでした。for ループと cuSOLVER 関数を使用してコードを記述した場合、cuSOLVER は自動的にリソースを分配し、計算を並列化しますか?
または、スレッド数を制御して関数を並列化できる cuSOLVER または cuBLAS API はありますか? ……
質問する
379 次