いくつかの一意ではない連続していない ID 番号によってインデックス付けされた pandas データフレームがあります。
x
クラス 'pandas.core.frame.DataFrame'
Int64Index: 814061 エントリ、8536896 ~ 8498857
データ列 (合計 1 列):
受信した 814061 個の非 null 値
dtypes: datetime64ns
x['received'] は、すべて同じ長さではないタイムスタンプです。
x.ix[i] might have len() == 20
x.ix[j] might have len() == 32.
任意の x.ix[i] に対して、タイムスタンプを [0,1] の範囲に収めることができます
df['totalseconds'] = x.ix[i]['received']-x.ix[i]['received'].min()
y = x.ix[i]['received'].max()-x.ix[i]['received'].min()
z = timedelta.total_seconds(y)
df['seconds'] = df['totalseconds'].apply(lambda x: x / timedelta64(1, 's'))
df['norm'] = df['seconds']/z
x の各インデックスの期間を正規化しようとしています。しかし、なぜか困っています。
tldr; すべてのタイムスタンプを [0, 1] の範囲に、インデックス ID で取得するにはどうすればよいですか?