OpenCL で FFT を実行しようとしています。このようなカーネルでうまくいきました。
__kernel void butterfly(__global float2* twid, __global float2* X,
const int n,}
{
/* Butterfly structure*/
}
私はこのカーネルを何千回も呼んでいます。したがって、グローバル メモリへの READ/WRITE には時間がかかりすぎます。twid(float2) 配列は読み取られるだけで、操作されることはなく、配列 X は READ & WRITE タイプの配列です。
1.これに最も適したメモリのタイプはどれですか? 2. ローカル メモリを使用する場合、グローバル メモリにコピーせずに別のカーネルに引数として渡すことはできますか?
私はOpenCLの初心者です。