コンポーネントが欠落しているデータがあるため、マウスアルゴリズムを実行しました(パッケージからmice
)。この関数は .mids オブジェクトを返します。これをトレーニング データセットとテスト データセットに分割して、モデルの適合性を評価します。トレーニング データとテスト データも .mids 形式にしてpool
、ルービンの規則に従って標準誤差を調整するなど、他のさまざまな機能と組み合わせることができるようにしたいと考えています。
これは、トレーニングセットを取得するためにデータから行を削除するだけの私の試みです:
library(mice)
data <- mice(nhanes,m=2,maxit=5,seed=1)
set.seed(2)
rand <- (1:nrow(nhanes))*rbinom(nrow(nhanes),size=1,prob=0.7)
train <- data
train$data <- train$data[rand,]
しかし、このデータでモデルを実行しようとすると:
pool(with(train, lm(bmi ~ chl + age)))
9 行を 7 行に置き換えようとしているというエラーが表示されます (おそらく、他のものも調整せずに train$data の行数を減らしたためです)。
どんな助けでも大歓迎です。