python - タイムスタンプ付きデータを集計するより良い方法は?

翻译自：https://stackoverflow.com/questions/19818446 2013-11-06T17:15:59.163

2770 次

私は不均一に収集されたタイムスタンプのインデックス付きデータを扱っており、最終的には 1 分ごと、1 時間ごとに統計を計算する予定です。期間ごとに集計する最良の方法は何だろうと思っています。

現在、2 つのラムダ関数を計算してから、次のようにデータフレームに 2 つの列を追加します。

h = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:00:00'))
m = lambda i: pd.to_datetime(i.strftime('%Y-%m-%d %H:%M:00'))
df['hours'] = df.index.map(h)
df['minutes'] = df.index.map(m)

groupbyこれにより、次のように簡単に集約できます。

by_hour = df.groupby('hours')

これを行うためのより良い、またはよりPythonicな方法があると確信していますが、私はそれを理解していないので、助けていただければ幸いです。

python - タイムスタンプ付きデータを集計するより良い方法は?

1 に答える 1

Related

Reference