時間で測定されるイベント データがいくつかあるので、データ形式は次のようになります。
Time(s) Pressure Humidity
0 10 5
0 9.9 5.1
0 10.1 5
1 10 4.9
2 11 6
ここで、最初の列は実験開始からの経過時間 (秒単位) です。他の 2 つの列はいくつかの観察です。行は、特定の条件が真の場合に作成されます。これらの条件は、ここでの説明の範囲を超えています。セミコロンで区切られた 3 つの数値の各セットは、データの行です。ここでの時間の解決の最小粒度はわずか数秒であるため、同じタイムスタンプを持つ 2 つの行が存在する可能性がありますが、観察結果は異なります。基本的に、これらは時間が区別できなかった 2 つの異なるイベントでした。
今私の問題は、10秒または100秒ごと、または1000秒ごとにサブサンプリングすることにより、データシリーズをロールアップすることです。したがって、元のより粒度の高いデータ シリーズからスキミングされたデータ シリーズが必要です。どの行を使用するかを決定する方法はいくつかあります。たとえば、10 秒ごとにサブサンプリングしているとします。10 秒が経過すると、タイム スタンプが 10 秒の行が複数ある可能性があります。あなたはどちらかを取ることができます
1) first row
2) mean of all rows with the same timestamp of 10
3) some other technique
私はこれをパンダでやろうとしています。アイデアや開始方法は非常に高く評価されます。ありがとう。