デバイスのメモリ配列に継続的に格納されているM、それぞれのサイズの一連のシングル チャネル イメージがあります。NxN(Nは 2 のべき乗ではありません。) したがって、配列の長さはMxNxNです。これらの各画像のすべてのピクセルの合計を見つける必要があります。したがって、出力はM画像ごとに 1 つの値になります。
すべてのピクセルの画像インデックスを保持する追加の配列を生成し、このインデックスをreduce_by_key各画像 (セグメント) に使用しています。これreduce_by_keyはかなり遅いようで、これらのピクセルで行っている他のすべてよりも時間がかかります。
セグメントがすべて同じサイズである場合、このセグメント化された削減合計を行うためのより高速な方法はありますか?