セクション長が可変の配列の要素を合計する関数を実装する必要があります。それで、
a = np.arange(10)
section_lengths = np.array([3, 2, 4])
out = accumulate(a, section_lengths)
print out
array([ 3., 7., 35.])
私はここで実装を試みましcython
た:
https://gist.github.com/2784725
numpy
パフォーマンスのために、section_lengthsがすべて同じである場合の純粋なソリューションと比較しています。
LEN = 10000
b = np.ones(LEN, dtype=np.int) * 2000
a = np.arange(np.sum(b), dtype=np.double)
out = np.zeros(LEN, dtype=np.double)
%timeit np.sum(a.reshape(-1,2000), axis=1)
10 loops, best of 3: 25.1 ms per loop
%timeit accumulate.accumulate(a, b, out)
10 loops, best of 3: 64.6 ms per loop
パフォーマンスを改善するための提案はありますか?