を使用して大きな csv ファイルを読み込んでいますread.csv
。いくつかの Web サイトでは、colClasses を使用して各列のクラスを定義し、インポート プロセスを高速化することを提案しています。
t = read.csv("pca.csv",header=TRUE,colClasses = classes)
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got 'NULL'
classes = c("numeric","integer")
一部のデータには明らかに null があります。「数値」または「整数」にnullが含まれるcolClassesを使用する方法はありますか? また、大規模なデータセットを R に高速にインポートするためのその他のヒントは非常に役立ちます。SQL データベースにすべてのデータがあり、read.csv() よりも驚くほど遅い RODBC を使用してみました。