これは、ディスクリート GPU、主に最近の GPU (NVIDIA Kepler、Maxwell、および AMD Kaveri と R290 にあるもの) に関する質問です。
それ以外の場合はキャッシュされていない要素をレジスタにロードするのにどれくらいかかりますか...
- グローバルデバイスメモリ?
- グローバルメモリの L2 キャッシュ?
- テクスチャ キャッシュ?
- 定数キャッシュ?
- コアごとの L1 キャッシュ?
- (コアごとの共有メモリ - L1 キャッシュと同じにする必要があります。)
どこかのテーブルへのリンクは素晴らしいでしょう、説明は大丈夫でしょう...