0

単純なカーネル コードを作成し、1 次元配列要素を操作しようとしました。

    #include "stdio.h"

__global__ void Loop(double *X, int CellsNum, int VarNum,const double constant1)
{

int idx = threadIdx.x+blockDim.x*blockIdx.x;
int i = (idx+1)*VarNum ;
double exp1,exp2,exp3,exp4 ;

if(idx<CellsNum-2) {

exp1=double(0.5)*(X[i+6+VarNum]+X[i+6])+X[i+10] ;
exp2=double(0.5)*(X[i+8+VarNum]+X[i+8]) ;

if(i==0) {
printf("%e %e",exp1,exp2) ;
}

exp3=X[i+11]-constant1*(exp1*exp2)/X[i+5] ;

exp4=constant1*(X[i+9]*exp1-X[i+9-VarNum]*exp2)/X[i+5] ;

X[i+12]=exp3+exp4;
}
}

extern "C" void cudacalc_(double *a, int* N1, int* N2, double* N3)
{
int Cells_Num = *N1;
int Var_Num = *N2;
double constant1 = *N3;

Loop<<<1,Cells_Num>>>(a,Cells_Num,Var_Num,constant1);

}

しかし、このコードにコメントするとうまくいきません:

if(i==0) {
printf("%e %e",exp1,exp2) ;
}

変数 i が常にゼロより大きい場合でも。私がコメントするよりも、この行のコードは X 配列で NaN を生成します。-arch sm_20 フラグでコンパイルされたこのコードを Tesla GPU で実行しようとしています。多分誰かがこの問題で私を助けることができますか?

4

1 に答える 1

0

このカーネルは競合状態になる可能性があります。これは、カーネル コードが同期や保護なしで読み取りXと書き込みの両方を行っているためです。X

これを修正する最も簡単な方法は、おそらく出力ステートメントを分離して別の配列に書き込むことです。

Xo[i+12]=exp3+exp4;

cuda-memcheckカーネル内の競合状態をチェックするのに役立ちます。cuda-memcheck --help特定のオプションを見つけるために使用しracecheckます。

于 2013-08-24T01:06:17.103 に答える