大きな(約10GB)xdf(レボリューションRフォーマット)ファイルでランダムフォレストを実行する方法はありますか?明らかに、rxReadXdfを試してデータフレームに変換することはできますが、私のマシンには8 GBのRAMしかなく、将来的にはさらに大きなデータセットを処理する可能性があります。たとえば、foreachループを使用して、クアッドコアマシンで1000本のツリーを実行したいと思います。
#'train.xdf" is a 10gb training data set
rf<- foreach(ntree=rep(250, 4), .combine=combine,
.packages='randomForest') %do%
randomForest(amount2~.,data="train", ntree=ntree, importance=TRUE,
na.action=na.omit, replace=FALSE)
しかし、randomForestは「train」(xdf)ファイルを取り込むことができません。データフレームに読み込まずにxdfで直接ランダムフォレストを実行する方法はありますか?
乾杯、agsub