3

OpenCL カーネル内でローカル メモリ アクセス パターンを最適化したいと考えています。構成可能なローカルメモリについてどこかで読みました。たとえば、ローカル メモリに使用する量と自動キャッシュに使用する量を構成できる必要があります。

また、最新の (Kepler) Nvidia ハードウェアのバンク サイズを選択できることも読みました: http://www.acceleware.com/blog/maximizing-shared-memory-bandwidth-nvidia-kepler-gpus。この点は、倍精度値をローカル メモリに格納する場合に非常に重要と思われます。

Nvidia は、CUDA ユーザー専用のローカル メモリを設定する機能を提供していますか? OpenCL の同様のメソッドが見つかりません。では、これは別の方法で呼び出されているのでしょうか、それとも実際には存在しないのでしょうか?

4

1 に答える 1

5

残念ながら、OpenCL を使用する場合、L1 キャッシュ/ローカル メモリ構成を制御する方法はありません。この機能は、CUDA ランタイムによってのみ提供されます (cudaDeviceSetCacheConfigまたはを介し​​てcudaFuncSetCacheConfig)。

于 2014-09-16T14:09:21.250 に答える