時間インデックスを持つ pandas データフレームを使用しています。数年分の毎日のデータがあり、季節ごとの比較を行う必要があります。
メソッドを使用して期間を抽出し、新しい時系列を作成できることはわかっていtruncate
ますが、カスタムの「期間」を定義できるかどうか疑問に思っています (例: 5 月 1 日から 9 月 1 日まで)。次に、その期間のみの2つの異なる時系列間の相関係数を計算したいと思います。これを行う方法はありますか?
いくつかのサンプルデータ:
import pandas as pd
import numpy as np
rng = pd.date_range('1/1/2000', periods=4380, freq='D')
df = pd.DataFrame(np.random.randn(4380, 4), index=rng)
問題:
これらの時系列の相関係数を計算したいと思います(ランダムデータの場合、あまり意味がありません...とにかく)特定の期間のみ。つまり、「春」と「冬」だけの相関関係は?春と冬をカスタム期間として定義できる場所は? 基本的に、関心のある季節以外の期間を「マスク」したいだけです。