これがforeachパッケージを使用してやろうとしていることです。欠損値が多い 600 行と 58000 列のデータ セットがあります。
missForestというパッケージを使って欠損値を代入する必要があり、並列ではないため、このデータを一度に実行するには非常に時間がかかります。そのため、データを同じ数の行(私の行)と異なる数の列(マーカー)を持つ7つのデータセット(7つのコアがあります)に分割することを考えています。次に%dopar%
、データセットを並列に missForest に渡すために使用しますか?
データをより小さなデータ セットに分割し、それらのデータ セットを missForest に渡してから、出力を再結合する方法がわかりません。
方法を教えていただければ幸いです。
これは、私の問題を示す小さな例です。フォーム BLR パッケージです。
library(BLR)
library(missForest)
data(wheat)
X2<- prodNA(X, 0.1)
dim(X2) ## i need to divide X2 to several 7 data frames (ii)
X3<- missForest(X2)
X3$Ximp ## combine ii data frames