2

randomForest の predict() 関数を使用して、4 つのデータ欠損種のクラスを予測しようとしています。元のデータに対して RF を実行し、RF オブジェクトを作成しました。これを使用して、新しいデータのクラスを予測したいと考えています。

私が使用しているコードは次のとおりです。

# original data set "procellminvar" 
# DD sp only "procelldd"

#run RF on original data set

    procellminvar$current.red.list<-factor(procellminvar$current.red.list)
    procell6<-procellminvar[,6:80]
    procell6.imputed<-rfImpute(current.red.list~.,procell6)
    procellminvar.rf<-randomForest(current.red.list~., procell6.imputed, votes=true, importance=TRUE, ntree=1000)
    round(importance(procellminvar.rf),2)

#run prediction using original data and new data (DD sp only)

    predict(procellminvar.rf, procelldd)

RF は正常に動作しますが、予測を実行しようとすると、次のエラー メッセージが表示されます。

predict(procellminvar.rf, procelldd)
# Error in eval(expr, envir, enclos) : object 'subpop' not found

理由がわかりません。ここで私が間違っていることを簡単に説明してくれる人はいますか?

4

1 に答える 1

1

問題は、完全なデータセットで予測を実行しているが、トレーニングで完全なデータセットを使用していないことだと思います。元の変数も使用していません。したがって、トレーニングで使用している各変数がテスト データにも存在することを確認する必要があります。

于 2013-11-14T19:20:10.297 に答える