2

パフォーマンスのボトルネックと思われるコードを以下に示します。

for x, y, intensity in myarr:
  target_map[x, y] = target_map[x,y] + intensity

可変強度の同じ座標に対して複数の座標があります。

データ型:

> print myarr.shape, myarr.dtype
(219929, 3) uint32

> print target_map.shape, target_map.dtype
(150, 200) uint32

C で記述する以外に、このループを最適化する方法はありますか?

これは関連する質問のようですが、受け入れられた答えを得ることができませんでした: How to convert python list of points to numpy image array?

次のエラー メッセージが表示されます。

Traceback (most recent call last):
  File "<pyshell#38>", line 1, in <module>
    image[coordinates] = 1
IndexError: too many indices for array
4

1 に答える 1

1

を使用して 2D 座標をtarget_mapフラット インデックスに変換すると、 と を使用してかなり高速化np.ravel_multi_indexできます。np.uniquenp.bincount

def vec_intensity(my_arr, target_map) :
    flat_coords = np.ravel_multi_index((my_arr[:, 0], my_arr[:, 1]),
                                       dims=target_map.shape)
    unique_, idx = np.unique(flat_coords, return_inverse=True)
    sum_ = np.bincount(idx, weights=my_arr[:, 2])
    target_map.ravel()[unique_] += sum_
    return target_map

def intensity(my_arr, target_map) :
    for x, y, intensity in myarr:
        target_map[x, y] += intensity
    return target_map

#sample data set
rows, cols = 150, 200
items = 219929
myarr = np.empty((items, 3), dtype=np.uint32)
myarr[:, 0] = np.random.randint(rows, size=(items,))
myarr[:, 1] = np.random.randint(cols, size=(items,))
myarr[:, 2] = np.random.randint(100, size=(items,))

そしていま:

In [6]: %timeit target_map_1 = np.zeros((rows, cols), dtype=np.uint32); target_map_1 = vec_intensity(myarr, target_map_1)
10 loops, best of 3: 53.1 ms per loop

In [7]: %timeit target_map_2 = np.zeros((rows, cols), dtype=np.uint32); target_map_2 = intensity(myarr, target_map_2)
1 loops, best of 3: 934 ms per loop

In [8]: np.all(target_map_1 == target_map_2)
Out[8]: True

これは、ほぼ 20 倍の速度の増加です。

于 2013-06-24T23:22:39.387 に答える