パッケージのmice
関数を使用して代入戦略を作成したい。問題は、このパッケージに新しいデータのメソッド (またはいとこ) がmice
見つからないように見えることです。predict
私はこのようなことをしたい:
require(mice)
data(boys)
train_boys <- boys[1:400,]
test_boys <- boys[401:nrow(boys),]
mice_object <- mice(train_boys)
train_complete_boys <- complete(train_boys)
# Here comes a hypothetical method
test_complete_boys <- predict(mice_object, test_boys)
上記のコードをエミュレートするアプローチを見つけたいと思います。現在、トレーニングデータセットとテストmice
データセットに対して別々の操作を個別に実行することは完全に可能ですが、論理的な観点からは正しくないように思われます。すべての情報はトレーニングデータセットにあります。テストデータセットからの観測は、相互に情報を提供するべきではありません。これは、観測を出現時間順に並べることができるデータを扱う場合に特に当てはまります。
考えられるアプローチの 1 つは、テストデータセットから行を追加してデータセットを繰り返しトレーニングし、毎回代入を実行することです。しかし、これは非常に洗練されていないようです。
だからここに質問があります:
mice
一般的な方法に似たパッケージの方法はありpredict
ますか? そうでない場合、可能な回避策は何ですか?
ありがとうございました!