3

これをコンパイルすると

__global__ void dummy_kernel(float *a, int N, float* b, int N2){
    unsigned int i = blockIdx.y*blockDim.y + threadIdx.y;
    unsigned int j = blockIdx.x*blockDim.x + threadIdx.x; 
}

この空のptxコードを取得します

.entry _Z9dummy_kernelPfiS_i(
.param .u64 _Z9dummy_kernelPfiS_i_param_0,
.param .u32 _Z9dummy_kernelPfiS_i_param_1,
.param .u64 _Z9dummy_kernelPfiS_i_param_2,
.param .u32 _Z9dummy_kernelPfiS_i_param_3
)
{

ret; 
}

まったく最適化せずにコンパイラに強制的に ptx を生成させる方法はありますか?

4

1 に答える 1

4

Try -g -G switches And see what it puts out I'm not sure that will cover all possible optimizations

于 2012-10-14T16:19:31.723 に答える