カーネル構造に関連するものがあるのだろうか。カーネル内のすべての行が GPU で動作するわけではありませんか?
たとえば、私はこのコードを持っています:
#pragma acc kernels copy(a[0:n],b[0:n])
    {
        #pragma acc loop
        for (i = 0; i < n; i++)
            a[i] = i+10;   
        a[1] = 10;
        a[3] = 5;
        #pragma acc loop
        for (i = 0; i < n; i++)
            b[i] = i+20;
    }
また、ACCパラレル構造でも同じですか?