2

df = read_csv('data\query.csv')

私は得ています:

    TIMESTAMP   MILLISECONDS    PRICE
0   15.10.2012 08:00:06     350     24.6
1   15.10.2012 08:00:06     630     24.7
2   15.10.2012 08:00:06     640     24.9
3   15.10.2012 08:00:06     650     24.5
4   15.10.2012 08:00:06     710     24.3

私はこれが

df = read_csv('data\query.csv', parse_dates=[[0, 1]], index_col=0)

最初の2つの列を文字列に連結していますが、それでもインデックスをDatetimeIndexとして認識していません

さらにこれ

Import datetime
datetime.datetime.strptime("15.10.2012 15:30:00 890", "%d.%m.%Y %H:%M:%S %f")

変換ジョブを実行しています。

質問:read_csvで1回のラッシュで変換とDatetimeIndexを実行する方法は?

4

3 に答える 3

1
In [188]: from dateutil import parser

In [189]: from StringIO import StringIO

In [190]: data = """\
TIMESTAMP;MILLISECONDS;PRICE
15.10.2012 08:00:06;350;24.6
"""

In [191]: def date_parser(s):
    return parser.parse(s[:-4]).replace(microsecond=int(s[-3:])*1000)
   .....:

In [192]: df = pd.read_csv(StringIO(data), sep=';', parse_dates=[[0, 1]], date_parser=date_parser)

In [193]: df
Out[193]:
       TIMESTAMP_MILLISECONDS  PRICE
0  2012-10-15 08:00:06.350000   24.6

In [194]: df.set_index('TIMESTAMP_MILLISECONDS', inplace=True)
Out[194]:
                            PRICE
TIMESTAMP_MILLISECONDS
2012-10-15 08:00:06.350000   24.6

In [195]: df.index
Out[195]:
<class 'pandas.tseries.index.DatetimeIndex'>
[2012-10-15 08:00:06.350000]
Length: 1, Freq: None, Timezone: None
于 2012-10-30T20:07:49.937 に答える
0

pandas コードにコンバーターを追加することを検討してください: https://github.com/pydata/pandas/blob/master/pandas/tseries/converter.py

参照: https://github.com/pydata/pandas/issues/1180

于 2012-10-31T20:02:44.150 に答える