私は R と FF パッケージを初めて使用し、ユーザーが FF を使用して大規模なデータセット (>4Gb) を操作できるようにする方法をよりよく理解しようとしています。私はかなりの時間を Web のチュートリアルのトロールに費やしてきましたが、見つけることができたものは一般的に頭を悩ませています。
私は実行することで最もよく学ぶので、演習として、R の組み込みの「Indometh」データセットと同様に、任意の値を使用して長い形式の時系列データセットを作成する方法を知りたいと思います。次に、ワイドフォーマットに再形成したいと思います。次に、出力をcsvファイルとして保存したいと思います。
小さなデータセットの場合、これは簡単で、次のスクリプトを使用して実現できます。
##########################################
#Generate the data frame
DF<-data.frame()
for(Subject in 1:6){
for(time in 1:11){
DF<-rbind(DF,c(Subject,time,runif(1)))
}
}
names(DF)<-c("Subject","time","conc")
##########################################
#Reshape to wide format
DF<-reshape(DF, v.names = "conc", idvar = "Subject", timevar = "time", direction = "wide")
##########################################
#Save csv file
write.csv(DF,file="DF.csv")
しかし、約 10 Gb のファイル サイズに対してこれを行う方法を学びたいと思います。FFパッケージを使用してこれを行うにはどうすればよいですか? 前もって感謝します。