3

これがforeachパッケージを使用してやろうとしていることです。欠損値が多い 600 行と 58000 列のデータ セットがあります。

missForestというパッケージを使って欠損値を代入する必要があり、並列ではないため、このデータを一度に実行するには非常に時間がかかります。そのため、データを同じ数の行(私の行)と異なる数の列(マーカー)を持つ7つのデータセット(7つのコアがあります)に分割することを考えています。次に%dopar%、データセットを並列に missForest に渡すために使用しますか?

データをより小さなデータ セットに分割し、それらのデータ セットを missForest に渡してから、出力を再結合する方法がわかりません。

方法を教えていただければ幸いです。

これは、私の問題を示す小さな例です。フォーム BLR パッケージです。

library(BLR)
library(missForest)
data(wheat)
X2<- prodNA(X, 0.1)
dim(X2)                 ## i need to divide X2 to several 7 data frames (ii)

X3<- missForest(X2)

X3$Ximp  ## combine ii data frames
4

3 に答える 3