cuda - cuda の関数デバイスの最大呼び出し数

Question

グローバル関数でデバイス関数を 1000000 回以上呼び出そうとしています。しかし、常に次のエラーが発生します: Microsoft C++ 例外: cudaError_enum at memory location 0x0031fc24 しかし、コードは単純です。スレッドデバイスからスレッドホストに戻る実行スレッドが一部のリソースを非同期的にロックする可能性はありますか? ご覧のとおり、変数にオーバーフローはありません。では、何が起こっているのでしょうか?

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <math.h>

#include "cuda.h"
#include "curand_kernel.h"

#define NDIM 30 
#define NPAR 3 

#define DIMPAR NDIM*NPAR //

__device__ float f(float *inputs){
    float t = 0.0;
    int i;
    for(i = 0 ; i < 15; i++)
        t+= inputs[i]*0.0001;
    return t;
}

__global__ void kernel(float *pos, float *pbest){

    int thread = threadIdx.x + blockDim.x * blockIdx.x;
    int i = 0;
    float tpbest = 0.0;

    if(thread < DIMPAR){
        do{
            tpbest = f(pbest);
            i++;
        }while(i <  1000000); //max length int 2147483648 > 1000000

    }
}


int main(int argc, char *argv[])
{

    float *d_pos,    *h_pos;
    float *d_pbest,  *h_pbest;


    h_pos   = ( float *) malloc(sizeof( float ) * DIMPAR);
    h_pbest = ( float *) malloc(sizeof( float ) * DIMPAR);

    cudaMalloc((void**)&d_pos, DIMPAR   * sizeof( float ));
    cudaMalloc((void**)&d_pbest, DIMPAR * sizeof( float ));

    int i, numthreadsperblock, numblocks;

    numthreadsperblock = 512;
    numblocks = (DIMPAR / numthreadsperblock) + ((DIMPAR % numthreadsperblock)?1:0);
    printf("numthreadsperblock: %i;; numblocks:%i\n", numthreadsperblock, numblocks);

    //fill in host code
    for(i = 0 ; i < DIMPAR ; i++){
        h_pos[i] = 1;
        h_pbest[i] = 1;
    }

    //transf. to device memory
    cudaMemcpy(d_pos, h_pos, DIMPAR * sizeof( float ), cudaMemcpyHostToDevice);
    cudaMemcpy(d_pbest, h_pbest, DIMPAR * sizeof( float ), cudaMemcpyHostToDevice);

    kernel<<<numblocks,numthreadsperblock>>>(d_pos, d_pbest);
    cudaMemcpy(h_pos, d_pos, DIMPAR * sizeof( float ), cudaMemcpyDeviceToHost); 



    return 0;
}

score 1 · Accepted Answer

完全なエラーメッセージは次のようなものだと思います：

First-chance exception at 0x7c812a5b in myapp.exe: Microsoft C++ exception: cudaError_enum at memory location 0x0031fc24...

CUDA コードで適切なcuda エラーチェックを行う必要があります (ただし、コードを実行したところ、明らかな API エラーは見られませんでした)。

上記の方法 (適切な CUDA エラーチェック) で CUDA エラーが報告されていない場合は、このエラーを安全に無視できます。これは、コードにリンクされる CUDA ライブラリ内でトラップされ、適切に処理される例外が原因です。

アプリケーションは引き続き正常に実行されます。Visual Studio の外部で実行可能ファイルを実行すると、このメッセージは表示されないと思います。

この特定のメッセージが消えるかどうかを確認するために、CUDA 5.5 に更新してみてください。

別の指標として、アプリを実行するとcuda-memcheck、さまざまな種類のエラーもチェックされます。

cuda - cuda の関数デバイスの最大呼び出し数

1 に答える 1

Related

Reference