1

マルチ GPU 環境でコードをプロファイリングしようとしていますclGetEventProfilingInfo()が、異なる GPU からのタイムスタンプを関連付けることができないようです。単純なコード サンプルは、2 つの GPU を使用すると 1 つを使用する場合よりも 2 倍高速ですが、タイム スタンプは、1 つの GPU が他の GPU が開始する前にほとんどの作業を実行したことを示しています。

[仕様] http://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/clGetEventProfilingInfo.html )は、そのようなタイムスタンプは「ナノ秒単位の現在のデバイス時間カウンター [...]" .

これらを同期する必要はないと想定する必要がありますか?


ご参考までに:

  • NVIDIA ドライバー バージョン 295.40、Linux カーネル 2.6.35 で 2 つの NVIDIA GTX 580 を使用しています。
  • すでにクロノス フォーラムでこの質問をしましたが、まだ返信がありません。
4

1 に答える 1

0

仕様には、「OpenCL デバイスは、デバイスの周波数と電源状態の変化全体で時間を正しく追跡する必要がある」とも書かれています。 返された時間は、2 つのデバイス間、および各デバイスと「実際の」壁時計時間との間で定数だけ異なることを意味します。

于 2012-08-23T16:31:08.073 に答える