現在、を使用して cuda カーネル (CUDA 5.0) を分析していますnvprof
。結合されていないメモリ負荷を確認しようとしました:
nvprof --events l1_global_load_hit myapplication
戻る:
1 0 0 0 l1_global_load_hit
と:
nvprof --events l1_global_load_miss myapplication
戻る
1 0 0 0 l1_global_load_miss
. 負荷がかからない理由を知っている人はいますか? 私のカーネルには間違いなく負荷があります。
nvprof --events gld_request myapplication
戻り値:
1515884425251588442525158844252 gld_request
助けてくれてありがとう!