7

私は約20GBの巨大なデータセットを持っています。graphlab.SFrame.read_csv() を使用してデータを読みました。yyyy-dd-mm 形式の文字列として読み取られる日付列があります。しかし、列を日時オブジェクトとして読み取りたいです。どうすればいいですか?

1 つの方法は、各行を反復処理し、Python コードを使用して変更することです。他に方法はありますか?速いかもしれませんか?

4

2 に答える 2

7

実際には、これには組み込みのメソッドがありgraphlab.SArrayます。Greg Whittier の回答のように、元の日付列がdatestring.

import graphlab
sf = graphlab.SFrame.read_csv('input.csv')
sf['datetime'] = sf['datestring'].str_to_datetime('%Y-%d-%m')
于 2015-11-26T20:28:09.047 に答える
3
import graphlab
import datetime as dt
sf = graphlab.SFrame.read_csv('input.csv') # dates in datestring column
sf['datetime'] = sf['datestring'].apply(lambda x: dt.datetime.strptime(x, '%Y
-%d-%m'))
于 2015-11-26T18:37:10.747 に答える