1

私は R データ マイニング アルゴリズムの初心者で、イベントの予測に役立つスクリプトを開発する必要があります。そこで、このタスクに役立つ決定木モデルを選択しました。

私のデータセットはこの構造を持っています:

_____________________________
ATTR1 | ATTR2 | ATTR3 | CLASS
  Y   |   N  |   N    |    N
______|______|_______ |_______

これは私が作成したスクリプトです:

library(party)
myFormula <- CLASS ~ ATTR1 + ATTR2 + ATTR3

ind <- sample(2, nrow(myData), replace=TRUE, prob = c(0.7,0.3))
trainData <- myData[ind==1,]
testData <- myData[ind==2,]

energy_ctree <- ctree(myFormula, data=trainData)
testpred <- predict(energy_ctree, newdata= testData)

このコマンドはすべて正常に機能します。だから、私の疑いは、データの新しい行を予測しようとしています!

CLASS列を除く新しいデータセットで関数predict(energy_ctree ,newdata=newdataSet)を呼び出しました(決定木モデル予測で見つけたい)。

これは私が得るエラーメッセージです:

"Error in checkData(oldData, RET) : 
  Levels in factors of new data do not match original data"

では、以前に作成した decisionTree モデルに基づいて、newDataSet のクラス列を予測する手順は何ですか。

前もって感謝します。

カルロス・リマ

4

4 に答える 4

0

トレーニング データの変数のクラスに変更を加えた場合 (char を因子に変換するなど)、テスト データセットに同じ変更を反映する必要があります。これらの変更を行った後、スムーズに実行されます。

于 2018-11-18T09:47:09.340 に答える