4

トレーニング データに 30 因子レベルの予測子があります。テスト データには同じ予測因子の因子レベルが 30 ありますが、一部のレベルが異なります。そして、レベルが正確に同じでない限り、randomForest は予測しません。エラーを示します。言う、predict.randomForest(model,test) のエラー新しい因子レベルがトレーニング データに存在しない

4

4 に答える 4

2

これを使用してレベルを一致させます (ここでのテストとトレーニングは、テスト データセットとトレーニング データセットの列を参照します)。

test<-factor(test, levels=levels(train))
于 2015-09-17T06:27:42.760 に答える
1

これに対する簡単な解決策は、テストデータをトレーニングデータでrbindし、予測を行い、予測からrbindデータをサブセット化することです.Tested method

于 2015-11-04T13:17:04.770 に答える