30

「rpart」パッケージでモデルをトレーニングするためにキャレットパッケージを使用しています。

tr = train(y ~ ., data = trainingDATA, method = "rpart")

データには欠損値や NA はありませんが、コマンドを実行すると警告メッセージが表示されます。

    Warning message:
In nominalTrainWorkflow(x = x, y = y, wts = weights, info = trainInfo,  :
  There were missing values in resampled performance measures.

この警告の意味を知っている人はいますか (または答えを見つける場所を教えてくれますか)。リサンプリングされたパフォーマンス測定値に欠損値があったことを私に伝えていることは知っていますが、それは正確には何を意味し、どのようにしてそのような状況が発生するのでしょうか? ところで、predict() 関数は適合モデルで正常に動作するので、それは私の好奇心です。

4

6 に答える 6

27

より多くのデータがなければ、決定的にはわかりません。

これが回帰である場合、最も可能性の高いケースは、ツリーが適切な分割を見つけられず、結果の平均を予測子として使用したことです。それは問題ありませんが、予測の分散がゼロであるため、R^2 を計算することはできません。

分類するなら、言うのは難しいです。結果クラスの 1 つにゼロ サンプルがあるため、感度または特異性が定義されていないため、リサンプルが発生する可能性がありますNA

于 2014-11-14T20:36:53.120 に答える