5

画像処理のアプリ用のファイルがいくつかあります。画像処理アルゴリズムを実行している間、画像の行と列の数は変わらないので、それらの値を定数メモリに入れようとしていました。私のアプリは次のようになります。

Imageproc.cuh

...
...
__constant__ int c_rows;
__constant__ int c_cols;

#ifdef __cplusplus
   extern "C"
   {
#endif
   ...
   ...
#ifdef __cplusplus
   }
#endif

Imageproc.cu

...
...

int algorithm(float *a, const int rows, const int cols){
   ...
   ...
   checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
   checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));

   dim3 block(T, T);
   dim3 grid(cols/T+1, rows/T+1);

   kernel<<<grid, block>>>( ... );
   ...
   ...

}

コンパイルはうまくいきますが、プログラムを実行しようとするとinvalid device symbol cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int))

これらの変数を定数メモリに入れることはできませんか、それとも何が欠けていますか?

4

1 に答える 1