私はread_csv()
pandas の優れた機能を使用しています。
In [31]: data = pandas.read_csv("lala.csv", delimiter=",")
In [32]: data
Out[32]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 12083 entries, 0 to 12082
Columns: 569 entries, REGIONC to SCALEKER
dtypes: float64(51), int64(518)
しかし、scikit-learn の関数を適用すると、列に関する情報が失われます。
from sklearn import preprocessing
preprocessing.scale(data)
numpy 配列を与えます。
情報を失うことなく、scikit または numpy 関数を DataFrames に適用する方法はありますか?