私は元々、N行の12列で構成されるデータフレームを持っていました。最後の列は私のクラス (0 または 1) です。データフレーム全体を数値に変換する必要がありました
training <- sapply(training.temp,as.numeric)
しかし、次に、randomforest() ツールを分類子として使用するには、class 列を factor 列にする必要があると考えたので、そうしました。
training[,"Class"] <- factor(training[,ncol(training)])
ツリーの作成に進みます
training_rf <- randomForest(Class ~., data = trainData, importance = TRUE, do.trace = 100)
しかし、次の 2 つのエラーが発生します。
1: In Ops.factor(training[, "Status"], factor(training[, ncol(training)])) :
<= this is not relevant for factors (roughly translated)
2: In randomForest.default(m, y, ...) :
The response has five or fewer unique values. Are you sure you want to do regression?
誰かが私が行っているフォーマットの間違いを指摘していただければ幸いです。
ありがとう!