3

利用可能な時間のみを含む時系列データを読み込んでいます。これにより、Series欠損値はありませんが、不等間隔のインデックスになります。Seriesこれを、欠損値のある等間隔のインデックスに変換したいと思います。間隔がどうなるかアプリオリにわからないので、現在次のような関数を使用しています

min_dt      = np.diff(series.index.values).min()
new_spacing = pandas.DateOffset(days=min_dt.days, seconds=min_dt.seconds,
                                microseconds=min_dt.microseconds)
series      = series.asfreq(new_spacing)

間隔がどうあるべきかを計算します (これは Pandas 0.7.3 を使用していることに注意してください - Numpy 1.6 での正しい動作のために series.index.to_pydatetime() を使用する必要があるため、0.8 ベータ コードは少し異なって見えます)。

pandas ライブラリを使用してこの操作を行う簡単な方法はありますか?

4

1 に答える 1

0

データがない場所に NaN が必要な場合はMinute()、datetools にある場所を使用できます (pandas 0.7.x 以降)。

from pandas.core.datetools import day, Minute
tseries.asfreq(Minute())

これにより、データのないシリーズ値として NaNs との 1 分の差がある等間隔の時系列が提供されるはずです。

于 2012-06-27T16:07:34.543 に答える