FermiGPUがL1またはL2キャッシュへのプリフェッチをサポートしていることを理解しています。しかし、CUDAリファレンスマニュアルには何も見つかりません。
Dues CUDAを使用すると、カーネルコードで特定のデータを特定のレベルのキャッシュにプリフェッチできますか?
命令レベルではありませんが、GPUでのプリフェッチに関する詳細情報は次のとおりです。
GPGPUアプリケーション用の多スレッド対応プリフェッチメカニズム
(マイクロアーキテクチャに関するACMシンポジウム2010の論文)
命令リファレンスは、nVIDIAのPTXISAリファレンスドキュメントにあります。関連する手順はとprefetch
ですprefetchu
。