cuda - cuda プロファイラ l1_global_load_hit と l1_global_load_miss がゼロを返す

Question

現在、を使用して cuda カーネル (CUDA 5.0) を分析していますnvprof。結合されていないメモリ負荷を確認しようとしました:

nvprof --events l1_global_load_hit myapplication

戻る:

 1         0         0         0  l1_global_load_hit

と：

nvprof --events l1_global_load_miss myapplication

戻る

1         0         0         0  l1_global_load_miss

. 負荷がかからない理由を知っている人はいますか? 私のカーネルには間違いなく負荷があります。

nvprof --events gld_request myapplication

戻り値：

                    1515884425251588442525158844252  gld_request

助けてくれてありがとう！

score 2 · Accepted Answer

Kepler マイクロアーキテクチャ GPU (Compute Capability 3.x) の場合、デフォルトグローバルメモリロードは L1 にキャッシュされません。

1 に答える 1