質問 01:
スレッド間でデータ要求の頻度が非常に高い場合 (すべてのスレッドが特定の列から少なくとも 1 つのデータを選択する場合)、コンスタント メモリ内のデータ ストレージを使用すると、Pascal アーキテクチャのテクスチャよりも利点がありますか?
質問 02:
定数メモリからのまったく同じ命令データのワープ要求のすべてのスレッドが、すべてのスレッドが異なるアドレスからそれを要求する場合 (ブロードキャストなし)、パフォーマンスはテクスチャ メモリよりも悪くなりますか?
質問 03:
定数メモリとテクスチャのキャッシュのパフォーマンスは同じですか? 両方とも同じような寸法ですか?Pascal アーキテクチャで定数またはテクスチャのキャッシュ ディメンションを操作できますか?
バックグラウンド:
カーネルには、テクスチャ メモリ内の 2D マトリックスの特定の列からいくつかの float データを確実に要求する部分があり、通常、すべてのスレッドは、前のスレッドから要求されたデータの「下」にある隣接するセルに格納されたデータを要求します。
同じワープ内の 2 つのスレッドがまったく同じアドレスを要求する頻度は、ほとんどのワープで 25% 未満ですが、ワープの 10% 未満で 50% に達することがあります。
この特定の列が 95% のケースで cmem に適合することは確かです。