0

pandas 時系列 (Python) のリサンプリング関数の奇妙な動作が発生しています。pandasの最新バージョン(0.12.0)を使用しています

次の時系列を取ります。

dates = [datetime(2011, 1, 2, 1), datetime(2011, 1, 2, 2), datetime(2011, 1, 2, 3),
          datetime(2011, 1, 2, 4), datetime(2011, 1, 2, 5), datetime(2011, 1, 2, 6)]
ts = Series(np.arange(6.), index=dates)

次に、66 秒と 65 秒にリサンプリングしてみます。これは私が得る結果です:

In [45]: ts.resample('66min')
Out[45]:
2011-01-02 01:00:00    0.5
2011-01-02 02:06:00    2.0
2011-01-02 03:12:00    3.0
2011-01-02 04:18:00    4.0
2011-01-02 05:24:00    5.0
Freq: 66T, dtype: float64

In [46]: ts.resample('65min')
Out[46]:
2011-01-02 01:00:00     0
2011-01-02 02:05:00   NaN
2011-01-02 03:10:00   NaN
2011-01-02 04:15:00   NaN
2011-01-02 05:20:00   NaN
2011-01-02 06:25:00   NaN
Freq: 65T, dtype: float64

66 秒にリサンプリングするときの動作は理解しています。常に、それぞれの間隔のすべての値の平均 (デフォルト) を取ります。65 の動作に影響を与える方法がわかりません。

これは単純化された問題です。バックグラウンドは、リサンプリングを含む、より複雑なデータ修正プロセスです。

何か案は?

4

1 に答える 1