6

を使用して大きな csv ファイルを読み込んでいますread.csv。いくつかの Web サイトでは、colClasses を使用して各列のクラスを定義し、インポート プロセスを高速化することを提案しています。

t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings,  : 
scan() expected 'a real', got 'NULL'

classes = c("numeric","integer")

一部のデータには明らかに null があります。「数値」または「整数」にnullが含まれるcolClassesを使用する方法はありますか? また、大規模なデータセットを R に高速にインポートするためのその他のヒントは非常に役立ちます。SQL データベースにすべてのデータがあり、read.csv() よりも驚くほど遅い RODBC を使用してみました。

4

1 に答える 1

12

への通話で使用na.strings='NULL'しますread.csv

于 2012-06-19T20:06:28.907 に答える