2

私は不均一に収集されたタイムスタンプのインデックス付きデータを扱っており、最終的には 1 分ごと、1 時間ごとに統計を計算する予定です。期間ごとに集計する最良の方法は何だろうと思っています。

現在、2 つのラムダ関数を計算してから、次のようにデータフレームに 2 つの列を追加します。

h = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:00:00'))
m = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:%M:00'))
df['hours'] = df.index.map(h)
df['minutes'] = df.index.map(m)

groupbyこれにより、次のように簡単に集約できます。

by_hour = df.groupby('hours')

これを行うためのより良い、またはよりPythonicな方法があると確信していますが、私はそれを理解していないので、助けていただければ幸いです。

4

1 に答える 1