4

次の試行は、コンパイルに失敗した私の意図を示しています。

__host__ __device__ void f(){}

int main()
{
    f<<<1,1>>>();
}

コンパイラの苦情:

a.cu(5): error: a __device__ function call cannot be configured

1 error detected in the compilation of "/tmp/tmpxft_00001537_00000000-6_a.cpp1.ii".

私の声明が明確であることを願っています。アドバイスに感謝します。

4

2 に答える 2

12

関数などの CUDA カーネル エントリ ポイントを作成する必要があり__global__ます。何かのようなもの:

#include <stdio.h>

__host__ __device__ void f() {
#ifdef __CUDA_ARCH__
    printf ("Device Thread %d\n", threadIdx.x);
#else
    printf ("Host code!\n");
#endif
}

__global__ void kernel() {
   f();
}

int main() {
   kernel<<<1,1>>>();
   if (cudaDeviceSynchronize() != cudaSuccess) {
       fprintf (stderr, "Cuda call failed\n");
   }
   f();
   return 0;
}
于 2013-06-12T00:13:57.303 に答える