私は科学アプリケーションに使用されるGPUに関する理論的なものを研究していて、次の文を見つけました。
高い演算強度と多くのデータ要素は、ビッグデータキャッシュの代わりに計算によってメモリアクセスレイテンシを隠すことができることを意味します。
これは正確にはどういう意味ですか?GPUのプログラミング時に事前に計算された結果を保存しないようにするための提案として解釈できますが、デバイスで関数を実行するたびにそれらを計算しますか?
たとえば、大量の計算を含む長い配列を計算するために再帰ループを実行するコードがあるとします。さらに、ループ内で一部の計算をスキップするのに役立つ部分配列を事前に計算できると仮定します。これは、それほど高価ではないものもあります。引用によると、これを回避する必要がありますが、サイクルごとにこれらの配列を計算する必要がありますか?