ピン留めまたはページロックされたメモリは、ロックされていないメモリと比較して、GPUに高速に転送されます。CUDAは、ページロックメモリを割り当てまたは登録するためのcudaHostAllocおよび呼び出しを提供します。cudaHostRegister次に、Nvidiaドライバーは、ホストメモリがロックされているかどうかをメモリ転送でチェックし、コピーコードパスに従って発行します。
システムコールでメモリをページロックして、mlock()(転送速度に関して)まったく同じ効果を達成することは可能cudaHostRegisterですか?または、それに応じたCUDA呼び出しは、ドライバーが照会する内部データベースを更新しますか?