0

質問 01:

スレッド間でデータ要求の頻度が非常に高い場合 (すべてのスレッドが特定の列から少なくとも 1 つのデータを選択する場合)、コンスタント メモリ内のデータ ストレージを使用すると、Pascal アーキテクチャのテクスチャよりも利点がありますか?

質問 02:

定数メモリからのまったく同じ命令データのワープ要求のすべてのスレッドが、すべてのスレッドが異なるアドレスからそれを要求する場合 (ブロードキャストなし)、パフォーマンスはテクスチャ メモリよりも悪くなりますか?

質問 03:

定数メモリとテクスチャのキャッシュのパフォーマンスは同じですか? 両方とも同じような寸法ですか?Pascal アーキテクチャで定数またはテクスチャのキャッシュ ディメンションを操作できますか?

バックグラウンド:

カーネルには、テクスチャ メモリ内の 2D マトリックスの特定の列からいくつかの float データを確実に要求する部分があり、通常、すべてのスレッドは、前のスレッドから要求されたデータの「下」にある隣接するセルに格納されたデータを要求します。

同じワープ内の 2 つのスレッドがまったく同じアドレスを要求する頻度は、ほとんどのワープで 25% 未満ですが、ワープの 10% 未満で 50% に達することがあります。

この特定の列が 95% のケースで cmem に適合することは確かです。

4

0 に答える 0