次の構造の DataFrame があります。
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 3333 entries, 2000-01-03 00:00:00+00:00 to 2012-11-21 00:00:00+00:00
Data columns:
open 3333 non-null values
high 3333 non-null values
low 3333 non-null values
close 3333 non-null values
volume 3333 non-null values
amount 3333 non-null values
pct_change 3332 non-null values
dtypes: float64(7)
pct_change
列にはパーセント変化データが含まれます。
上記の DataFrame からフィルター処理された DatetimeIndex を指定すると、次のようになります。
<class 'pandas.tseries.index.DatetimeIndex'>
[2000-03-01 00:00:00, ..., 2012-11-01 00:00:00]
Length: 195, Freq: None, Timezone: UTC
各日付エントリの開始をフィルタリングし、pct_change
列が 0.015 未満の最初の行を返します。
私はこの解決策を思いつきましたが、非常に遅いです:
stops = []
#dates = DatetimeIndex
for d in dates:
#check if pct_change is below -0.015 starting from date of signal. return date of first match
match = df[df["pct_change"] < -0.015].ix[d:][:1].index
stops.append([df.ix[d]["close"], df.ix[match]["close"].values[0]])
これを改善する方法について何か提案はありますか?