1

現時点では Fermi を持っていませんが、ターゲット プラットフォームは tesla/Fermi です。質問したいのは、Fermi が次のような Open MP をサポートしているかどうかです。

#pragma omp parallel for num_threads(N)

for (int i=0; i<1000; ++i)
{
  int threadID=omp_get_thread_num();
  cudafunctions<<<blocks, threads, 1024, streams[threadID]>>>(input+i*colsizeofinput);
}//where there are N streams created.
4

1 に答える 1

1

はい、そのようなことが可能です。OpenMPは、(ストリームが提供するものを超えて)同じデバイスに対して複数のカーネルを起動しようとする場合に特定の利点を提供せず、それが意図している場合は、カーネルの同時実行を実現する必要はありません。

CUDAを使用したOpenMPの一般的な使用例は、複数のデバイスを管理することです

于 2013-03-14T06:13:11.093 に答える