私はこの非常に単純なコードを持っています.nvccはコンパイルに時間がかかります. これはループの展開が原因ですか? ローカルメモリをより速く初期化する簡単な方法はありますか?
#include "cuda_runtime.h"
#include <stdio.h>
#include "cuComplex.h"
__global__ void test()
{
cuComplex myPoints[20][20];
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
myPoints[i][j].x=0.0;
myPoints[i][j].y=0.0;
}
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
printf("%d %d",myPoints[i][j].x,myPoints[i][j].y);
}
}
main()
{
}