私のデータフレームDF
に2つの列$A
とが含まれているとし$B
ます。$A
常に存在します。$B
値が欠落している場合、NaNとコード化されることがあります。$B.predicted
、の欠落値を予測し、 ifがNaNで、それ以外の場合のよう$B
な新しい列を作成したいと思います。$B.complete
$B.complete[i]
$B.predicted
$B[i]
$B[i]
従属変数として因子を必要とする多項分布を使用して、完全な観測値があるBを次のように予測します。
DF$B.factor <- factor(DF$B)
model.results <- multinom(formula=B.factor ~ A,
data=DF[!is.na(DF$B),])
B.predicted <- predict(model.result, newdata=DF, type="class")
変数B.predicted
は因子です。
私のDF$B
コラムは要因ではありません。
Muの質問は、どのようにマージDF$B
しB.predicted
て作成するB.complete
かです。特に、B.predicted
は要因でありDF$B
、そうではないので、このコードは正しい値を取得しますか?
B.complete <- ifelse(is.na(DF$B), $B.predicted, DF$B)