CUDA 2.0 デバイスで、特定の 1 つの変数に対してのみ L1 キャッシュを無効にする方法はありますか? すべてのメモリ操作に対してフラグ-Xptxas -dlcm=cg
を追加して、コンパイル時に L1 キャッシュを無効にできることを知っています。nvcc
ただし、特定のグローバル変数でのメモリ読み取りに対してのみキャッシュを無効にして、残りのすべてのメモリ読み取りが L1 キャッシュを通過するようにしたいと考えています。
私が Web で行った検索に基づいて、考えられる解決策は PTX アセンブリ コードを使用することです。