次のようにしてCUDA定数メモリにコピーできることがわかっているマッピングテーブルがあります。
#define LENGTH 4
#define THREAD_BLOCKS 64
const int mapTable[LENGTH] = {0, 1, 3, 5};
int main()
{
//..
__constant__ int dMapTable[LENGTH];
cudaMemcpyToSymbol( dMapTable , mapTable, size_t(LENGTH) * sizeof(int) , 0, cudaMemcpyHostToDevice );
//..
}
ここでやりたいことは、このテーブルの複数のコピーを CUDA 定数メモリに作成することです。作成するコピーの数は、スレッド ブロック THREAD_BLOCKS の数と同じです。これを行う方法とこれを効率的に行う方法を教えてもらえますか?