python - インデックスのループ用パンダ

翻译自：https://stackoverflow.com/questions/19776546 2013-11-04T20:29:40.303

346 次

いくつかの一意ではない連続していない ID 番号によってインデックス付けされた pandas データフレームがあります。

x
クラス 'pandas.core.frame.DataFrame'
Int64Index: 814061 エントリ、8536896 ～ 8498857
データ列 (合計 1 列):
受信した 814061 個の非 null 値
dtypes: datetime64ns

x['received'] は、すべて同じ長さではないタイムスタンプです。

x.ix[i] might have len() == 20  
x.ix[j] might have len() == 32.

任意の x.ix[i] に対して、タイムスタンプを [0,1] の範囲に収めることができます

df['totalseconds'] = x.ix[i]['received']-x.ix[i]['received'].min()
y = x.ix[i]['received'].max()-x.ix[i]['received'].min()
z = timedelta.total_seconds(y)
df['seconds'] = df['totalseconds'].apply(lambda x: x / timedelta64(1, 's'))
df['norm'] = df['seconds']/z

x の各インデックスの期間を正規化しようとしています。しかし、なぜか困っています。

tldr; すべてのタイムスタンプを [0, 1] の範囲に、インデックス ID で取得するにはどうすればよいですか?

python - インデックスのループ用パンダ

0 に答える 0

Related

Reference