cuda - CUDA で L2 キャッシュを使用する方法

Question

CUDA での L2 キャッシュの使用について、他のスレッドを検索しました。しかし、解決策を見つけることができません。L2 キャッシュを利用するにはどうすればよいですか? その使用のための呼び出し関数または宣言はありますか? 同様に、共有メモリを使用するには、を使用します__device__ __shared__。L2キャッシュにそのようなものはありますか??

score 4 · Accepted Answer

L2 キャッシュは、デバイスコードに対して透過的です。L1 でヒットしなかったメモリ (グローバル、ローカル、サーフェス、テクスチャ、定数、および命令) へのすべてのアクセスは、L2 に移動します。すべての書き込みは L2 を通過します。

CUDA C プログラミングガイド F.4.2 : グローバルメモリ

このセクションでは、L2 についてさらに詳しく説明します。

コンパイラフラグ -dlcm=cg を使用すると、グローバルアクセスを L1 でキャッシュ解除し、L2 でキャッシュすることができます。

CUDA C プログラミングガイド B.5 : メモリフェンス関数

関数 __threadfence() を使用して、グローバルメモリへのすべての書き込みが L2 で確実に見えるようにすることができます。

関数 __threadfence_system() を使用して、グローバルメモリへのすべての書き込みがホストスレッドから見えるようにすることができます。

cuda - CUDA で L2 キャッシュを使用する方法

1 に答える 1

Related

Reference