0

そこ(http://db.tt/9SG85XFK)にパンダのデータフレームをプロットしています。2 つの変数を持つ 'timestamp' のインデックス (青と緑の曲線としてプロット)。

青い曲線変数が多かれ少なかれ一定であるそのデータフレームのサブセットを抽出したいと思います(特定の値を下回る std.variation?)。

したがって、添付のプロットでは、3 つの異なるサブセット ~(41000:41170、41180:41315、および 41320:41580) が抽出されます。

これを行うためのきれいな方法はありますか?ループを介して実行できますが、正しい方法かどうかはわかりません。

ありがとう、

N

4

1 に答える 1

1

おそらく、関数の機能が必要ですrolling_std

標準偏差 (たとえば 100 データ ポイント) を確認する間隔の幅を指定し、適切な標準偏差 (たとえば 10) を選択して、次の操作を行います。

 import pandas as pd
 s = pd.Series(the way you get your data)
 std = pd.rolling_std(s, 100)
 selected = s[std < 10]

そして、周囲の 100 個のデータ ポイントの中で標準偏差が 10 未満のすべてのデータ ポイントを取得します。

于 2013-08-07T11:03:17.640 に答える