8

パンダでは、特定のウィンドウでデータを操作する方法がいくつかあります (例:pd.rolling_meanpd.rolling_std.)。しかし、ウィンドウのオーバーラップを設定したいと思います。たとえば、次の画像では、ウィンドウが 256 サンプルにまたがり、128 サンプルがオーバーラップしていることがわかります。

http://health.tau.ac.il/Communication%20Disorders/noam/speech/mistorin/images/hamming_overlap1.JPG

Pandas または Numpy に含まれる最適化されたメソッドを使用してそれを行うにはどうすればよいですか?

4

3 に答える 3

9

you を使用as_stridedすると、次のようになります。

import numpy as np
from numpy.lib.stride_tricks import as_strided

def windowed_view(arr, window, overlap):
    arr = np.asarray(arr)
    window_step = window - overlap
    new_shape = arr.shape[:-1] + ((arr.shape[-1] - overlap) // window_step,
                                  window)
    new_strides = (arr.strides[:-1] + (window_step * arr.strides[-1],) +
                   arr.strides[-1:])
    return as_strided(arr, shape=new_shape, strides=new_strides)

上記の関数に 1D 配列を渡すと、 shape を使用してその配列に 2D ビューが返される(number_of_windows, window_size)ため、たとえばウィンドウ平均を次のように計算できます。

win_avg = np.mean(windowed_view(arr, win_size, win_overlap), axis=-1)

例えば:

>>> a = np.arange(16)
>>> windowed_view(a, 4, 2)
array([[ 0,  1,  2,  3],
       [ 2,  3,  4,  5],
       [ 4,  5,  6,  7],
       [ 6,  7,  8,  9],
       [ 8,  9, 10, 11],
       [10, 11, 12, 13],
       [12, 13, 14, 15]])
>>> windowed_view(a, 4, 1)
array([[ 0,  1,  2,  3],
       [ 3,  4,  5,  6],
       [ 6,  7,  8,  9],
       [ 9, 10, 11, 12],
       [12, 13, 14, 15]])
于 2013-08-15T11:07:36.397 に答える