python - Pythonは、指定されたウィンドウで累積合計を実行します

Question

私がやりたいのは、特定のウィンドウで指定された別のnumpy配列の累積合計であるnumpy配列を生成することです。

たとえば、配列が与えられた場合、[1,2,3,4,5,6,7,8,9,10,11,12]ウィンドウが3の累積合計が必要だとします。出力として必要なのは[1,3,6,9,12,15,18,21,24,27,30,33]。です。私は比較的大きなnumpy配列を持っていて、400のウィンドウで累積合計を実行したいと思います。

score 33 · Accepted Answer

これは、シフトされた累積を差し引くことに基づいた、おそらくより簡単な答えです。

>>> a = np.array([1,2,3,4,5,6,7,8,9,10,11,12])
>>> b = a.cumsum()
>>> b[3:] = b[3:] - b[:-3]
>>> b
array([ 1,  3,  6,  9, 12, 15, 18, 21, 24, 27, 30, 33])

score 8 · Accepted Answer

本当に速度を気にしないのでなければ、おそらくnumpyを使うべきです（とにかく私はそれを好むでしょうが）。したがって、畳み込みまたはベースのアプローチを使用できますstride_tricks（これらは明白ではありませんが、これらのことをうまく解決します）。

たとえば、このような関数が与えられた場合（より多くのより洗練されたバージョンも見つけることができます）：

def embed(array, dim, lag=1):
    """Create an embedding of array given a resulting dimension and lag.
    The array will be raveled before embedding.
    """
    array = np.asarray(array)
    array = array.ravel()
    new = np.lib.stride_tricks.as_strided(array,
                                     (len(array)-dim*lag+lag, dim),
                                     (array.strides[0], array.strides[0]*lag))
    return new

できるよ：

embedded = embed(array, 400)
result = embedded.sum(1)

これはメモリ効率が高く（埋め込みまたはそれを呼び出すものは何でも、ビューを作成するだけです）、高速です。もちろん、他のアプローチは畳み込みを使用することです。

np.convolve(array, np.ones(400), mode='valid')

完全でないウィンドウも必要かどうかはわかりません。これはmode='full'、畳み込みに（デフォルト）を使用するのと同じです。他のアプローチの場合、それは他の方法で処理する必要があります。

score 3 · Accepted Answer

In [42]: lis=[1,2,3,4,5,6,7,8,9,10,11,12]

In [43]: w=3       #window size

In [44]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1])  for i in range(len(lis))]
Out[44]: [1, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33]

In [45]: w=4

In [46]: [sum(lis[i-(w-1):i+1]) if i>(w-1) else sum(lis[:i+1])  for i in range(len(lis))]
Out[46]: [1, 3, 6, 10, 14, 18, 22, 26, 30, 34, 38, 42]

Python 2.4以下の場合、三項演算子を変更します。

(falseValue, trueValue)[condition]それ以外のtrueValue if condition else falseValue

[(sum(lis[:i+1]),sum(lis[i-(w-1):i+1]))[i>(w-1)]  for i in range(len(lis))]

score 1 · Accepted Answer

sebergの答えは私のものよりも優れており、より一般的ですが、希望する結果を得るには、サンプルをゼロパッドする必要があることに注意してください。

import numpy as np
from numpy.lib.stride_tricks import as_strided as ast
samples = 100
window = 3
padding = np.zeros(window - 1)
# zero-pad your samples
a = np.concatenate([padding,np.arange(1,samples + 1)])
newshape = (len(a) - window,window)
newstrides = a.strides * 2
# this gets you a sliding window of size 3, with a step of 1
strided = ast(a,shape = newshape,strides = newstrides)
# get your moving sum
strided.sum(1)

python - Pythonは、指定されたウィンドウで累積合計を実行します

4 に答える 4

Related

Reference