parallel-processing - opencl での複数のカーネル呼び出し

Question

clSetKernelArg(memory_object) を使用してカーネル引数を設定し、clEnqueueNDKernelRangeKernel( ) を使用してカーネルを複数回呼び出すと、以前にカーネルの clSetKernelArg( ) で引数として設定した memory_object がホストから GPU に転送されます。カーネルを呼び出すたびに？

    status = clSetKernelArg(kernel, 0, sizeof(cl_mem), &inbuf);



    size_t num_total_wi = M * N;
    size_t num_wg = num_elem/N + ((num_elem/N == 0) ? 0 : 1); 
    size_t num_iter = num_elem/(num_total_wi) + (((num_elem % (num_total_wi)) == 0) ?     0 : 1); 
    for(i = 0; i < num_iter; i++) {
            size_t global_work_size[3] = {num_total_wi, 1, 1};    
            size_t local_ws[3] = {N, 1, 1}; 
            size_t global_offset[3] = {i * num_total_wi, 0, 0}; 

            clEnqueueNDRangeKernel(queue, kernel, 1, global_offset, global_work_size, local_ws, 0, NULL, NULL);

    }

score 1 · Accepted Answer

メモリ転送は、clEnqueueWriteBufferまたはへの呼び出しによって開始されますが、が呼び出されclEnqueueWriteImageたときに開始される可能性がありますclEnqueueNDRangeKernel。データが転送されると、メモリオブジェクトを何度でも再利用でき、明示的に指定しない限り、データは再度転送されません。

parallel-processing - opencl での複数のカーネル呼び出し

1 に答える 1

Related

Reference