CUDA グリッド内の 1 つのプロセスから N 個の CUDA ブロックを起動する場合と、ブロック間の通信がないと仮定して、プロセスごとに 1 つの CUDA ブロックで N MPI プロセスを起動する場合の効率に違いはありますか?
1 に答える
1
いつものように、場合によります。
CUDA5 を使用していない場合は、Hyper Q
対応するデバイスを使用して、グリッド CUDA グリッドを 1 つのプロセスで起動する方が効率的です。そうでなければ、おそらく、それがテスト中であることを確認する唯一の方法だとは言えません。
あなたはこのビデオを見るのが好きかもしれません、特にJen Hsun Huangが話している部分Hyper Q
于 2012-08-05T22:26:50.910 に答える