CUDA Fermi のアーキテクチャについて質問があります。Fermi のアーキテクチャでは、グローバル メモリのアクセスが共有メモリのように高速であることをどこかで読んだことがあります。
では、(「フェルミ以前」の GPU とは異なり) (大きな) レイテンシなしでグローバル メモリ上のデータにアクセスできるというのは本当ですか?
Nvidia Tesla GPU を使用せずにコードをプログラミングしているという理由だけで、それを知ることは非常に重要です (大学の研究室にあり、夏の間はアクセスできません...)。