2つのパンダシリーズ間の累積相関を見つける組み込みのパンダの方法はありますか?
それがすべきことは、ウィンドウの幅が増加し、最終的にウィンドウにすべてのデータポイントが含まれるように、 pandas.rolling_corr(data, window) でウィンドウの左側を効果的に修正することです。
2つのパンダシリーズ間の累積相関を見つける組み込みのパンダの方法はありますか?
それがすべきことは、ウィンドウの幅が増加し、最終的にウィンドウにすべてのデータポイントが含まれるように、 pandas.rolling_corr(data, window) でウィンドウの左側を効果的に修正することです。
map
これは、インデックスの 1 つの方法でcorr
あり、シリーズのサイズの増加に適用されます。
In [116]: df.index.map(lambda x: df[col1].corr(df.loc[:x, col2]))
詳細
In [112]: df = pd.DataFrame(pd.np.random.rand(10,2))
In [113]: df
Out[113]:
0 1
0 0.094958 0.891910
1 0.482616 0.551912
2 0.877540 0.573768
3 0.839921 0.328452
4 0.334714 0.908346
5 0.530518 0.837590
6 0.285152 0.126937
7 0.386568 0.474815
8 0.279807 0.939694
9 0.741882 0.135982
In [114]: df['roll_corr'] = df.index.map(lambda x: df[0].corr(df.loc[:x, 1]))
In [115]: df
Out[115]:
0 1 roll_corr
0 0.094958 0.891910 NaN
1 0.482616 0.551912 -1.000000
2 0.877540 0.573768 -0.832929
3 0.839921 0.328452 -0.848385
4 0.334714 0.908346 -0.839698
5 0.530518 0.837590 -0.791736
6 0.285152 0.126937 -0.312806
7 0.386568 0.474815 -0.283357
8 0.279807 0.939694 -0.354385
9 0.741882 0.135982 -0.459907
検証
In [121]: df.corr()
Out[121]:
0 1
0 1.000000 -0.459907
1 -0.459907 1.000000
In [122]: df[:5].corr()
Out[122]:
0 1
0 1.000000 -0.839698
1 -0.839698 1.000000