0

CUDA ストリームが重複していない によると、「プロファイラーはストリーミングをシリアル化して、正確なタイミング データを取得します」。ここで問題は、cuda プロファイリング (nvvp など) でこのシリアル化動作を回避する方法はありますか? Fermin M2090 と cuda-4.0 を使用しています。

4

1 に答える 1

3

Visual Profiler 5.0 (nvprof および CUPTI を含む) および Nsight Visual Studio Edition 2.0 以降 (>2 年経過) は、Fermi および Kepler デバイスの同時カーネル トレースをサポートします。

于 2013-01-23T00:45:49.033 に答える