N×Nの2次元配列がある場合、その4分の1ごとに平均して、次のように同じ数にします。
matrix = [ 1 2 4 6
6 7 1 1
9 8 3 6
4 7 9 2 ]
そしてそれにcudaカーネルを適用した後、結果は次のようになります:
result = [ 4 4 3 3
4 4 3 3
7 7 5 5
7 7 5 5 ]
これをCcudaカーネルでどのように実装できますか?