サーフェス メモリは、CUDA のテクスチャ キャッシュに相当する書き込み専用です。
グローバル メモリと共有メモリからの読み取りに関する学術文献で、 NVIDIA GPUのピーク帯域幅の数値を見つけました。ただし、 CUDA メモリ デバイスの書き込みスループットに関する情報はほとんどありません。
特に、Fermi GPU と Kepler GPU の CUDA サーフェス メモリの帯域幅 (既知の場合はレイテンシも) に関心があります。
- これに関するベンチマークの数値はありますか?
- そうでない場合、表面メモリへの書き込みの帯域幅を測定するためのベンチマークをどのように実装できますか?