1

現在、を使用して cuda カーネル (CUDA 5.0) を分析していますnvprof。結合されていないメモリ負荷を確認しようとしました:

nvprof --events l1_global_load_hit myapplication

戻る:

 1         0         0         0  l1_global_load_hit

と:

nvprof --events l1_global_load_miss myapplication

戻る

1         0         0         0  l1_global_load_miss

. 負荷がかからない理由を知っている人はいますか? 私のカーネルには間違いなく負荷があります。

nvprof --events gld_request myapplication

戻り値:

                    1515884425251588442525158844252  gld_request

助けてくれてありがとう!

4

1 に答える 1

2

Kepler マイクロアーキテクチャ GPU (Compute Capability 3.x) の場合、デフォルト グローバル メモリ ロードは L1 にキャッシュされません

于 2016-02-08T22:32:41.417 に答える