私は次のdfを持っています:
Timestamp A B C ...
2014-11-09 00:00:00 NaN 1 NaN NaN
2014-11-09 00:00:00 2 NaN NaN NaN
2014-11-09 00:00:00 NaN NaN 3 NaN
2014-11-09 08:24:00 NaN NaN 1 NaN
2014-11-09 08:24:00 105 NaN NaN NaN
2014-11-09 09:19:00 NaN NaN 23 NaN
そして、私は次のことをしたいと思います:
Timestamp A B C ...
2014-11-09 00:00:00 2 1 3 NaN
2014-11-09 00:01:00 NaN NaN NaN NaN
2014-11-09 00:02:00 NaN NaN NaN NaN
... NaN NaN NaN NaN
2014-11-09 08:23:00 NaN NaN NaN NaN
2014-11-09 08:24:00 105 NaN 1 NaN
2014-11-09 08:25:00 NaN NaN NaN NaN
2014-11-09 08:26:00 NaN NaN NaN NaN
2014-11-09 08:27:00 NaN NaN NaN NaN
... NaN NaN NaN NaN
2014-11-09 09:18:00 NaN NaN NaN NaN
2014-11-09 09:19:00 NaN NaN 23 NaN
つまり、列を同じタイムスタンプ (17 個の列があります) でマージし、1 分の粒度で再サンプリングし、値のない列については NaN を使用したいと考えています。
私は次の方法で始めました:
df.groupby('Timestamp').sum()
と
df = df.resample('1Min', how='max')
しかし、次のエラーが発生しました。
ValueError: cannot reindex from a duplicate axis
どうすればこの問題を解決できますか? 私はPythonを学んでいるので、経験はまったくありません。
ありがとうございました!