6

CUDA 5の安定版を受け取りました。KeplerやMPIをより優れたパフォーマンスで使用し、同じカードを32個のアプリケーションで同時に実行する機能などの新しい用語がいくつかあります。私は少し混乱していますが、そのような質問の答えを探しています:

  • CUDA 5の機能を十分に活用するには、どのカードとコンピューティング機能が必要ですか?
  • GPUDirect、動的並列処理、ハイパーQ、動的並列処理など、Keplerアーキテクチャでのみ利用可能な新機能はありますか。
  • Fermiアーキテクチャを使用している場合、CUDA 5を使用する利点は何ですか?LinuxおよびEclipseでNSightを使用する機能以外の利点がありますか。最も重要な機能はライブラリを構築する機能だと思いますか?
  • CUDA4からCUDA5に移行するだけで、パフォーマンスが向上しましたか?(Linuxマシンで速度が向上しました)

私は次のようないくつかの文書を見つけました

しかし、より良い、短い説明は私たちの心をより明確にするかもしれません。

PS:上記の質問に答えを制限しないでください。私はいくつかの同様の質問を見逃しているかもしれません。

4

1 に答える 1

5

以前の GPU には、スレッドがカーネルを起動したり、他の API 呼び出しをハードウェア コマンド キューに直接挿入したりするために必要なハードウェアがないため、動的並列処理には計算能力 3.5 (GK110 など) が必要です。

Hyper-Q にはコンピューティング機能 3.5 が必要です。

SHFL 組み込み関数には CC 3.0 (GK104) が必要です

デバイス コードのリンク、NSight EE、nvprof、CUDA 5 でのパフォーマンスの向上とバグ修正は、Fermi およびそれ以前の GPU に役立ちます。

于 2012-10-19T10:22:30.950 に答える