Pandas では時系列インデックスの重複はまだ許可されていません ( https://github.com/pydata/pandas/issues/643 ) が、まもなく追加される予定です。マルチインデックスタグ/列によって重複した時間を持つデータセットにローリングウィンドウ平均を適用する良い方法があるかどうか疑問に思っています
基本的に、エポックタイム、階層タグ (tag1、tag2)、および所要時間で構成される順序付けられていないイベントの csv があります。小さなサンプル:
epochTimeMS,event,tag,timeTakenMS
1331782842801,event1,tag1,16
1331782841535,event1,tag2,1278
1331782842801,event1,tag1,17
1331782842381,event2,tag1,436
私がやりたいことは、イベントおよびイベント+タグによって、さまざまなミリ秒ウィンドウでローリング手段を構築およびグラフ化することです。これは Pandas で実現する必要があるようですが、最初に時系列インデックスが複製されるまで待つ必要があるかどうかはわかりません。これを今すぐハッキングすることについて何か考えはありますか?