GPU で次元 K x N の 2 次元配列を処理する必要があります。ここで、K は小さい数 (3、4、または 5) であり、N は数百万から数億の値です。処理は一度に 1 列の K 要素に対して行われ、各列はカーネルの個別の呼び出しによって処理されます。GPU で K x N 配列を表現する最も効率的な方法は次のとおりです。
1) 1 次元配列で、列の K 個の要素を連続した場所に配置して、各スレッドが要素 K*thread_id、K*thread_id + 1、...、K*thread_id + K - 1 を処理するようにします。
2) K 個の個別の 1-D 配列として、各配列は元の配列の 1 行を格納します。
3) 他の何か
ありがとうございました!