問題タブ [gpu-constant-memory]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
cuda - Pascal での cmem と texture のパフォーマンス
質問 01:
スレッド間でデータ要求の頻度が非常に高い場合 (すべてのスレッドが特定の列から少なくとも 1 つのデータを選択する場合)、コンスタント メモリ内のデータ ストレージを使用すると、Pascal アーキテクチャのテクスチャよりも利点がありますか?
質問 02:
定数メモリからのまったく同じ命令データのワープ要求のすべてのスレッドが、すべてのスレッドが異なるアドレスからそれを要求する場合 (ブロードキャストなし)、パフォーマンスはテクスチャ メモリよりも悪くなりますか?
質問 03:
定数メモリとテクスチャのキャッシュのパフォーマンスは同じですか? 両方とも同じような寸法ですか?Pascal アーキテクチャで定数またはテクスチャのキャッシュ ディメンションを操作できますか?
バックグラウンド:
カーネルには、テクスチャ メモリ内の 2D マトリックスの特定の列からいくつかの float データを確実に要求する部分があり、通常、すべてのスレッドは、前のスレッドから要求されたデータの「下」にある隣接するセルに格納されたデータを要求します。
同じワープ内の 2 つのスレッドがまったく同じアドレスを要求する頻度は、ほとんどのワープで 25% 未満ですが、ワープの 10% 未満で 50% に達することがあります。
この特定の列が 95% のケースで cmem に適合することは確かです。