3

NVIDIA GPU のパフォーマンスについて質問があります。2 つの配列間の補間を行う実装があります。線形メモリにピッチングされたテクスチャを使用すると、CUDA 配列を使用するよりも高速になります。今のところ、1 つの GPU だけで試してみました。これはすべての GPU に当てはまりますか、それとも違いがありますか? ラップトップで GPU を使用しています。デスクトップ GPU ははるかに高速ですか? 現時点では、スピードアップが 2 ~ 3 しか得られないからです。

ばかげた質問のように思えるかもしれませんが、多くの GPU でテクスチャを扱っている人からの回答に感謝します。CUDA-Arrays(キャッシュの最適化が必要です...)の使用が遅いのは不思議です。

私は NVIDIA Quadro 2000m に取り組んでおり、それを I7-2860QM @ 2,50GHZ (実装) と比較しています。これは公正なレースですか?

4

1 に答える 1

1

計算能力 2.0 以上の GPU はグローバル メモリとテクスチャをキャッシュするため、CC 1.x 時代にテクスチャが持っていた主な利点はなくなりました。

まったく逆に、テクスチャについて少し言及された事実は、複数の引数を格納し、ハードワイヤード レイアウトのレジスタに値を返す必要があるため、レジスタ プレッシャーを増加させる可能性があるということです。さらに、グローバル メモリのキャッシュは、テクスチャ メモリのキャッシュよりも大きくなります。したがって、テクスチャを介したメモリの読み取りが、グローバル メモリへの直接アクセスよりも遅くなることは予想外ではありません。

この特性は、ハイエンドのデスクトップ GPU がモバイル デバイスの約 2 倍から 5 倍高速である場合でも、モバイルまたはデスクトップ GPU で同じである必要があります。

于 2012-11-24T14:59:45.697 に答える