4

私のC OpenCLコードでは、カーネルで使用clSetKernelArgする「可変サイズ」__localメモリを作成するために使用しますが、これはOpenCL自体では利用できません。私の例を見てください:

clSetKernelArg(clKernel, ArgCounter++, sizeof(cl_mem), (void *)&d_B);
...
clSetKernelArg(clKernel, ArgCounter++, sizeof(float)*block_size*block_size, NULL);
...
kernel="    
    matrixMul(__global float* C,
                   ...
              __local float* A_temp,
                  ...
             )"
{...

私の質問は今、pyopenclで同じことをする方法ですか?

pyopencl に付属の例を調べたのですが、テンプレートを使用したアプローチしか見つかりませんでした。例を参照してください。

kernel = """
        __kernel void matrixMul(__global float* C,...){
                     ... 
            __local float A_temp[ %(mem_size) ];
                     ...
        }

おすすめは何ですか?

4

2 に答える 2

6

これは C に似ています。ローカルとして固定サイズの配列を渡します。Enja の基数ソートの例を次に示します。最後の引数がローカル メモリ配列であることに注意してください。

 def naive_scan(self, num):
    nhist = num/2/self.cta_size*16
    global_size = (nhist,)
    local_size = (nhist,)
    extra_space = nhist / 16 #NUM_BANKS defined as 16 in RadixSort.cpp
    shared_mem_size = self.uintsz * (nhist + extra_space)
    scan_args = (   self.mCountersSum,
                    self.mCounters,
                    np.uint32(nhist),
                    cl.LocalMemory(2*shared_mem_size)
                )
    self.radix_prg.scanNaive(self.queue, global_size, local_size, *(scan_args)).wait()
于 2011-05-06T22:11:44.813 に答える
3

私はPythonとそのOpenCLの実装に精通していませんが、カーネル内に固定サイズでローカルメモリを作成することもできます(あなたがしたことと同様):

__kernel void matrixMul(...) {

    __local float A_templ[1024];

}

1024 の代わりに、定義済みのプリプロセッサ シンボルを使用でき、コンパイル中に設定してサイズを変更できます。

#define SIZE 1024    
__kernel void matrixMul(...) {

        __local float A_templ[SIZE];

    }

SIZE は、cLBuildProgram のコンパイラ パラメータとして、または clCreateProgramWithSource の追加ソースとして、同じソース内で定義できます。

編集: Google で何かを見つけました ;-): http://www.google.com/url?sa=t&source=web&cd=4&ved=0CC8QFjAD&url=http%3A%2F%2Flinksceem.eu%2Fjoomla%2Ffiles%2FPRACE_Winter_School%2FLinkSCEMM_pyOpenCL. pdf&rct=j&q=Pyopencl%20__local%20memory&ei=BTbETbWhOsvBswadp62ODw&usg=AFQjCNG6rXEEkDpE1304pmQDu3GFdRA0BQ&sig2=vHOGOqwA1HHUl10c6HO8WQ&cad=rja

于 2011-05-06T17:51:04.817 に答える