こんにちは私はCAPSOpenACCコンパイラを使用していましたが、予備的なプロファイル結果を取得しようとすると、何か問題が発生します。
最初に、HMPPRT_LOG_LEVEL = "info"を宣言してコードを実行しました。これにより、タイムスタンプ付きのプロファイル結果が生成されます。
[ 2.612337] ( 0) INFO : Upload edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)
[ 2.613485] ( 0) INFO : Call __hmpp_acc_region__2ha750yb (queue=none, location=gravity_openacc.c:50)
[ 2.614367] ( 0) INFO : Free edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)
したがって、カーネルの実行時間は2.614367-2.613485=0.000882秒として計算されると思います。
しかし、CUDA_PROFILE = 1を宣言すると、以下のプロファイルが表示されます
method=[ __hmpp_acc_region__2ha750yb_parallel_region_1 ] gputime=[ 492.480 ] cputime=[ 13.000 ] occupancy=[ 0.250 ]
だから私はこれらの2つの結果についてかなり混乱しています、それは本当ですか?
誰かがいくつかの解決策を手に入れますか?
ありがとう!