ピン留めまたはページロックされたメモリは、ロックされていないメモリと比較して、GPUに高速に転送されます。CUDAは、ページロックメモリを割り当てまたは登録するためのcudaHostAlloc
および呼び出しを提供します。cudaHostRegister
次に、Nvidiaドライバーは、ホストメモリがロックされているかどうかをメモリ転送でチェックし、コピーコードパスに従って発行します。
システムコールでメモリをページロックして、mlock()
(転送速度に関して)まったく同じ効果を達成することは可能cudaHostRegister
ですか?または、それに応じたCUDA呼び出しは、ドライバーが照会する内部データベースを更新しますか?