私は R データ マイニング アルゴリズムの初心者で、イベントの予測に役立つスクリプトを開発する必要があります。そこで、このタスクに役立つ決定木モデルを選択しました。
私のデータセットはこの構造を持っています:
_____________________________
ATTR1 | ATTR2 | ATTR3 | CLASS
Y | N | N | N
______|______|_______ |_______
これは私が作成したスクリプトです:
library(party)
myFormula <- CLASS ~ ATTR1 + ATTR2 + ATTR3
ind <- sample(2, nrow(myData), replace=TRUE, prob = c(0.7,0.3))
trainData <- myData[ind==1,]
testData <- myData[ind==2,]
energy_ctree <- ctree(myFormula, data=trainData)
testpred <- predict(energy_ctree, newdata= testData)
このコマンドはすべて正常に機能します。だから、私の疑いは、データの新しい行を予測しようとしています!
CLASS列を除く新しいデータセットで関数predict(energy_ctree ,newdata=newdataSet)を呼び出しました(決定木モデル予測で見つけたい)。
これは私が得るエラーメッセージです:
"Error in checkData(oldData, RET) :
Levels in factors of new data do not match original data"
では、以前に作成した decisionTree モデルに基づいて、newDataSet のクラス列を予測する手順は何ですか。
前もって感謝します。
カルロス・リマ