CUDA ストリームが重複していない によると、「プロファイラーはストリーミングをシリアル化して、正確なタイミング データを取得します」。ここで問題は、cuda プロファイリング (nvvp など) でこのシリアル化動作を回避する方法はありますか? Fermin M2090 と cuda-4.0 を使用しています。
CUDA ストリームが重複していない によると、「プロファイラーはストリーミングをシリアル化して、正確なタイミング データを取得します」。ここで問題は、cuda プロファイリング (nvvp など) でこのシリアル化動作を回避する方法はありますか? Fermin M2090 と cuda-4.0 を使用しています。