プログラミングガイドとベストプラクティスガイドを調べたところ、グローバルメモリアクセスには400〜600サイクルかかると記載されていました。テクスチャキャッシュ、コンスタントキャッシュ、共有メモリなどの他のメモリタイプについてはあまり見かけませんでした。レジスタのメモリレイテンシは0です。
すべてのスレッドがコンスタントキャッシュで同じアドレスを使用する場合、コンスタントキャッシュはレジスタと同じだと思います。最悪の場合、私にはよくわかりません。
共有メモリは、バンクの競合がない限り、レジスタと同じですか?ある場合、レイテンシーはどのように展開しますか?
テクスチャキャッシュはどうですか?