R で rpart を使用して分類を行っています。ツリー モデルは次の方法でトレーニングされます。
> tree <- rpart(activity ~ . , data=trainData)
> pData1 <- predict(tree, testData, type="class")
このツリー モデルの精度は次のとおりです。
> sum(testData$activity==pData1)/length(pData1)
[1] 0.8094276
クロス検証によってツリーを剪定するチュートリアルを読みました。
> ptree <- prune(tree,cp=tree$cptable[which.min(tree$cptable[,"xerror"]),"CP"])
> pData2 <- predict(ptree, testData, type="class")
剪定された木の正解率は同じです。
> sum(testData$activity==pData2)/length(pData2)
[1] 0.8094276
剪定した木のどこが悪いのか知りたいですか?また、R でクロス検証を使用してツリー モデルをプルーニングするにはどうすればよいでしょうか? ありがとう。