マルチ GPU 環境でコードをプロファイリングしようとしていますclGetEventProfilingInfo()
が、異なる GPU からのタイムスタンプを関連付けることができないようです。単純なコード サンプルは、2 つの GPU を使用すると 1 つを使用する場合よりも 2 倍高速ですが、タイム スタンプは、1 つの GPU が他の GPU が開始する前にほとんどの作業を実行したことを示しています。
[仕様] http://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/clGetEventProfilingInfo.html )は、そのようなタイムスタンプは「ナノ秒単位の現在のデバイス時間カウンター [...]" .
これらを同期する必要はないと想定する必要がありますか?
ご参考までに:
- NVIDIA ドライバー バージョン 295.40、Linux カーネル 2.6.35 で 2 つの NVIDIA GTX 580 を使用しています。
- すでにクロノス フォーラムでこの質問をしましたが、まだ返信がありません。