2

cudamalloc()またはcublasalloc()関数を使用して割り当てられた行列にメモリブロックを使用して、cublas関数を呼び出すことができることに気付きました。cudamalloc()を使用して配列を使用することには他の利点もありますが、cublasalloc()ではなくcudamalloc()を使用して割り当てられた配列の場合、行列の転送速度と計算は遅くなります。なぜそうなのですか?いくつかのコメントを聞くのは素晴らしいことです。

4

1 に答える 1

5

cublasAlloc本質的にはラッパーでcudaMalloc()あるため、違いはありません。コードで変更するものは他にありますか?

于 2009-11-19T10:38:26.923 に答える