私は不均一に収集されたタイムスタンプのインデックス付きデータを扱っており、最終的には 1 分ごと、1 時間ごとに統計を計算する予定です。期間ごとに集計する最良の方法は何だろうと思っています。
現在、2 つのラムダ関数を計算してから、次のようにデータフレームに 2 つの列を追加します。
h = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:00:00'))
m = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:%M:00'))
df['hours'] = df.index.map(h)
df['minutes'] = df.index.map(m)
groupby
これにより、次のように簡単に集約できます。
by_hour = df.groupby('hours')
これを行うためのより良い、またはよりPythonicな方法があると確信していますが、私はそれを理解していないので、助けていただければ幸いです。