Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
cudamalloc()またはcublasalloc()関数を使用して割り当てられた行列にメモリブロックを使用して、cublas関数を呼び出すことができることに気付きました。cudamalloc()を使用して配列を使用することには他の利点もありますが、cublasalloc()ではなくcudamalloc()を使用して割り当てられた配列の場合、行列の転送速度と計算は遅くなります。なぜそうなのですか?いくつかのコメントを聞くのは素晴らしいことです。
cublasAlloc本質的にはラッパーでcudaMalloc()あるため、違いはありません。コードで変更するものは他にありますか?
cublasAlloc
cudaMalloc()