私のプログラムには2つのカーネルがあり、2番目のカーネルはすでにアップロードされた入力データと最初のカーネルからの結果を使用する必要があるため、メモリ転送を節約できます。これをどのようにアーカイブしますか?
これが私のカーネルを起動する方法です:
result = gpuarray.zeros(points, dtype=np.float32)
kernel(
driver.In(dataT),result,np.int32(points),
grid = (blocks,1),
block = (block_size, 1, 1),
)