Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
「cudaHostAlloc」によって割り当てられたピン留めされたメモリは、「malloc」されたメモリよりも効率的にデバイスに転送できることを理解しています。ただし、「cudaHostAlloc」はcudaコンパイラでしかコンパイルできないと思います。私のシナリオは、cudaコンパイラなしでcublas APIを使用することですが、cublasはハンドブックからの固定メモリ割り当ての機能を提供していないようです。または、何かが足りないかもしれません...
cudaHostAlloc()CUDAランタイムAPIに実装されています。CUDA API呼び出しを使用するためにnvccでコンパイルする必要はありません。適切なヘッダー(cuda_runtime_api.hなど)を含めて、ランタイムライブラリ(cudart)にリンクするだけです。
cudaHostAlloc()