欠損値を代入しようとしていますが、カテゴリ変数の処理に問題があります。コマンドsoftImpute
は欠損値を計算しますが、分析には不適切なカテゴリ変数も返します。欠損値については、次のことを行いました
>softImp = softImpute(as.matrix(train), rank.max = 60)
>data.comp = softImp$u %*% diag(softImp$d) %*% t(softImp$v)
>data.comp=data.frame(data.comp)
ただし、カテゴリ変数を見ると、小数点になっています
> head(data.comp$X91)
[1] 0.6037109 0.6263665 0.5373208 0.6092270 0.8796817 0.8643236
もともとは
> head(train[c(91)])
H0001600
1 0
2 0
3 1
4 1
5 0
6 1
カテゴリ変数の欠損値を代入する特定の方法はありますか? カテゴリ変数の欠損値を扱う他の提案も大いに役立ちます。