memory - グローバルメモリからローカルメモリへストライドコピーを作成するにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/17724836 2013-07-18T13:28:57.630

3178 次

グローバルデバイスメモリのバッファからプロセッシングコアのローカルメモリにデータをコピーしたいのですが、ひねりがあります。

私はasync_work_group_copyについて知っています、そしてそれは素晴らしいです（というか、それは不格好で面倒ですが、機能しています）。ただし、私のデータは連続していません。つまり、コピーしたい 2 つの連続する Y バイトごとに X バイトが存在する可能性があります。

明らかに、役に立たないデータをすべてコピーするつもりはありません。また、ローカルメモリに収まらない可能性もあります。代わりに何ができますか？コピーを行うために実際のカーネルコードを書くことを避けたい、例えば

threadId = get_local_id(0);
if (threadId < length) {
    unsigned offset = threadId * stride;
    localData[threadId] = globalData[offset];
}

memory - グローバル メモリからローカル メモリへストライド コピーを作成するにはどうすればよいですか?