rpartを使って分類木を作っています。データには 10 列あり、すべて適切にラベル付けされています。これらの列のうち 5 つには、曜日などの情報が "Wed" の形式で含まれており、他の 5 つの列には数値が含まれています。
Rpart を使用して正常にツリーを作成できますが、データのテスト セット、またはツリーを作成したトレーニング セットを実行しようとすると、文字を含む変数が因数に変更されたという警告が大量に表示されます。そして、それらの同じ変数が適合とは異なるタイプで指定されたというエラーが表示されます。
誰でもこれを修正する方法を知っていますか?
私の関連コードは
library(rpart)
#read data into info
info <- data.frame(info)
set.seed(30198)
train_ind <- sample(1:2000, 1500)
training_data_info <- info[train_ind, ]
test_data_info <- info[-train_ind, ]
training_data_info <- data.frame(training_data_info)
test_data_info <- data.frame(test_data_info)
tree <- rpart(info ~ ., data = training_data_info, method = "class")
info.test.fit <- predict(tree, newdata=test_data_info) #this is where it goes wrong