5

次のコードで、#define N 65536 を #if FSIZE よりも大きくすると、次のエラーが発生します。

#if FSIZE==1
__global__ void compute_sum1(float *a, float *b, float *c, int N)
{
#define N 65536
        int majorIdx = blockIdx.x;
        int subIdx = threadIdx.x;

        int idx=majorIdx*32+subIdx ;

        float sum=0;

        int t=4*idx;
        if(t<N)
        {
                c[t]= a[t]+b[t];
                c[t+1]= a[t+1]+b[t+1];
                c[t+2]= a[t+2]+b[t+2];
                c[t+3]= a[t+3]+b[t+3];
        }
        return;
}
#elif FSIZE==2
__global__ void compute_sum2(float2 *a, float2 *b, float2 *c, int N)
#define N 65536
{
        int majorIdx = blockIdx.x;
        int subIdx = threadIdx.x;

        int idx=majorIdx*32+subIdx ;

        float sum=0;

        int t=2*idx;
        if(t<N)
        {
                c[t].x= a[t].x+b[t].x;
                c[t].y= a[t].y+b[t].y;
                c[t+1].x= a[t+1].x+b[t+1].x;
                c[t+1].y= a[t+1].y+b[t+1].y;
        }
        return ;
}

float1vsfloat2.cu(10): エラー: ")" が必要です

この問題は少し厄介で、なぜそれが起こっているのか本当に知りたいです. 本当にばかげたものを見落としているような気がします。ところで、このコード セクションはファイルの先頭にあります。その前に #include すらありません。可能な説明があれば本当に感謝します。

4

1 に答える 1

14

プリプロセッサは次の行を変更します。

__global__ void compute_sum1(float *a, float *b, float *c, int N)

__global__ void compute_sum1(float *a, float *b, float *c, int 65536)

これは有効なCUDAコードではありません。

于 2011-02-11T15:55:34.170 に答える