0

CUDA Fermi のアーキテクチャについて質問があります。Fermi のアーキテクチャでは、グローバル メモリのアクセスが共有メモリのように高速であることをどこかで読んだことがあります。

では、(「フェルミ以前」の GPU とは異なり) (大きな) レイテンシなしでグローバル メモリ上のデータにアクセスできるというのは本当ですか?

Nvidia Tesla GPU を使用せずにコードをプログラミングしているという理由だけで、それを知ることは非常に重要です (大学の研究室にあり、夏の間はアクセスできません...)。

4

1 に答える 1

1

本当じゃない。Fermi でのグローバル メモリ アクセスは、共有メモリ アクセスに比べて比較的長くなります。ただし、キャッシュが原因で、キャッシュを直接ヒットしてレイテンシを短縮することができます。これは、理想的とは言えないメモリ アクセス パターン (わずかにミスアラインされたアクセスなど) で特に役立ちます。

均一なメモリアドレッシングは、上記とは関係なく、まったく別のものです。均一なメモリ アドレス指定により、指定されたメモリ ポインタがグローバルまたは共有 (またはマップされた固定ホストまたは他の GPU) メモリを参照している場合、GPU は実行時に差し引くことができます。Fermi より前のカードでは、メモリーのタイプはコンパイル時に推定可能でなければなりませんでした。

于 2012-08-11T22:47:42.733 に答える