python - Python を使用した自己相関の推定

Question

以下に示す信号に対して自己相関を実行したいと思います。2 つの連続するポイント間の時間は 2.5ms (または 400Hz の繰り返し率) です。

ここに画像の説明を入力

これは、私が使用したい autoacrrelation を推定するための方程式です ( http://en.wikipedia.org/wiki/Autocorrelationの推定セクションから取得):

ここに画像の説明を入力

Pythonでデータの推定自己相関を見つける最も簡単な方法は何ですか? 私が使用できるものに似たものはありnumpy.correlateますか？

それとも、平均と分散を計算するだけですか？

編集：

unutbuの助けを借りて、次のように書きました。

from numpy import *
import numpy as N
import pylab as P

fn = 'data.txt'
x = loadtxt(fn,unpack=True,usecols=[1])
time = loadtxt(fn,unpack=True,usecols=[0]) 

def estimated_autocorrelation(x):
    n = len(x)
    variance = x.var()
    x = x-x.mean()
    r = N.correlate(x, x, mode = 'full')[-n:]
    #assert N.allclose(r, N.array([(x[:n-k]*x[-(n-k):]).sum() for k in range(n)]))
    result = r/(variance*(N.arange(n, 0, -1)))
    return result

P.plot(time,estimated_autocorrelation(x))
P.xlabel('time (s)')
P.ylabel('autocorrelation')
P.show()

score 34 · Accepted Answer

この特定の計算用の NumPy 関数はないと思います。これが私がそれを書く方法です：

def estimated_autocorrelation(x):
    """
    http://stackoverflow.com/q/14297012/190597
    http://en.wikipedia.org/wiki/Autocorrelation#Estimation
    """
    n = len(x)
    variance = x.var()
    x = x-x.mean()
    r = np.correlate(x, x, mode = 'full')[-n:]
    assert np.allclose(r, np.array([(x[:n-k]*x[-(n-k):]).sum() for k in range(n)]))
    result = r/(variance*(np.arange(n, 0, -1)))
    return result

assert ステートメントは、計算をチェックし、その意図を文書化するためにあります。

assertこの関数が期待どおりに動作していることを確認したら、ステートメントをコメントアウトするか、 python -O. (-Oフラグは Python に assert ステートメントを無視するように指示します。)

score 17 · Accepted Answer

pandas autocorrelation_plot() 関数からコードの一部を取りました。Rで回答を確認したところ、値は正確に一致しています。

import numpy
def acf(series):
    n = len(series)
    data = numpy.asarray(series)
    mean = numpy.mean(data)
    c0 = numpy.sum((data - mean) ** 2) / float(n)

    def r(h):
        acf_lag = ((data[:n - h] - mean) * (data[h:] - mean)).sum() / float(n) / c0
        return round(acf_lag, 3)
    x = numpy.arange(n) # Avoiding lag 0 calculation
    acf_coeffs = map(r, x)
    return acf_coeffs

score 12 · Accepted Answer

statsmodels パッケージは、内部で使用する自己相関関数を追加しますnp.correlate(ドキュメントによるとstatsmodels)。

参照: http://statsmodels.sourceforge.net/stable/generated/statsmodels.tsa.stattools.acf.html#statsmodels.tsa.stattools.acf

score 8 · Accepted Answer

私が最新の編集で書いた方法は、サンプルサイズが非常に大きくなるまで、よりも高速scipy.statstools.acfになりました。fft=True

エラー分析バイアスを調整し、非常に正確なエラー推定値を取得したい場合: Ulli Wolff によるこの論文を実装する私のコードをここで見てください(または UW によるオリジナル)Matlab

テストされた機能

a = correlatedData(n=10000)ここにあるルーチンからのものです
gamma()と同じ場所からですcorrelated_data()
acorr()以下の私の機能です
estimated_autocorrelation別の回答で見つかりました
acf()からfrom statsmodels.tsa.stattools import acf

タイミング

%timeit a0, junk, junk = gamma(a, f=0)                            # puwr.py
%timeit a1 = [acorr(a, m, i) for i in range(l)]                   # my own
%timeit a2 = acf(a)                                               # statstools
%timeit a3 = estimated_autocorrelation(a)                         # numpy
%timeit a4 = acf(a, fft=True)                                     # stats FFT

## -- End pasted text --
100 loops, best of 3: 7.18 ms per loop
100 loops, best of 3: 2.15 ms per loop
10 loops, best of 3: 88.3 ms per loop
10 loops, best of 3: 87.6 ms per loop
100 loops, best of 3: 3.33 ms per loop

編集...サンプルを保持l=40して変更n=10000することを再度確認しn=200000、FFTメソッドが少し牽引力を獲得し始め、statsmodelsfftの実装がそれを縁取りました...（順序は同じです）

## -- End pasted text --
10 loops, best of 3: 86.2 ms per loop
10 loops, best of 3: 69.5 ms per loop
1 loops, best of 3: 16.2 s per loop
1 loops, best of 3: 16.3 s per loop
10 loops, best of 3: 52.3 ms per loop

編集 2: ルーチンを変更し、FFT との比較を再テストしましn=10000たn=20000

a = correlatedData(n=200000); b=correlatedData(n=10000)
m = a.mean(); rng = np.arange(40); mb = b.mean()
%timeit a1 = map(lambda t:acorr(a, m, t), rng)
%timeit a1 = map(lambda t:acorr.acorr(b, mb, t), rng)
%timeit a4 = acf(a, fft=True)
%timeit a4 = acf(b, fft=True)

10 loops, best of 3: 73.3 ms per loop   # acorr below
100 loops, best of 3: 2.37 ms per loop  # acorr below
10 loops, best of 3: 79.2 ms per loop   # statstools with FFT
100 loops, best of 3: 2.69 ms per loop # statstools with FFT

実装

def acorr(op_samples, mean, separation, norm = 1):
    """autocorrelation of a measured operator with optional normalisation
    the autocorrelation is measured over the 0th axis

    Required Inputs
        op_samples  :: np.ndarray :: the operator samples
        mean        :: float :: the mean of the operator
        separation  :: int :: the separation between HMC steps
        norm        :: float :: the autocorrelation with separation=0
    """
    return ((op_samples[:op_samples.size-separation] - mean)*(op_samples[separation:]- mean)).ravel().mean() / norm

4x高速化は以下で達成できます。そうしないとop_samples=a.copy()配列が変更されるため、渡すだけに注意する必要があります。aa-=mean

op_samples -= mean
return (op_samples[:op_samples.size-separation]*op_samples[separation:]).ravel().mean() / norm

サニティーチェック

エラー分析の例

これは少し範囲外ですが、統合された自己相関時間または統合ウィンドウの計算なしで図をやり直すことはできません。エラーを伴う自己相関は、下のプロットで明確です

python - Python を使用した自己相関の推定

5 に答える 5

テストされた機能

タイミング

実装

サニティーチェック

エラー分析の例

Related

Reference