大規模なデータセット(5000x300)でrandomForestを実行しようとしています。残念ながら、次のようなエラーメッセージが表示されます。
> RF <- randomForest(prePrior1, postPrior1[,6]
+ ,,do.trace=TRUE,importance=TRUE,ntree=100,,forest=TRUE)
Error in randomForest.default(prePrior1, postPrior1[, 6], , do.trace = TRUE, :
NA/NaN/Inf in foreign function call (arg 1)
だから私はNAを使って見つけようとします:
> df2 <- prePrior1[is.na(prePrior1)]
> df2
character(0)
> df2 <- postPrior1[is.na(postPrior1[,6])]
> df2
numeric(0)
NAがないように見えるので、問題はInfだと私は信じています。
Infを根絶する方法について何か提案はありますか?