Rのrpart
関数を使用すると、モデルを簡単に適合させることができます。例えば:
# Classification Tree with rpart
library(rpart)
# grow tree
fit <- rpart(Kyphosis ~ Age + Number + Start,
method="class", data=kyphosis)
printcp(fit) # display the results
plotcp(fit)
summary(fit) # detailed summary of splits
# plot tree
plot(fit, uniform=TRUE,
main="Classification Tree for Kyphosis")
text(fit, use.n=TRUE, all=TRUE, cex=.8)
私の質問は、モデルに対する3つの説明変数(年齢、数、開始)のそれぞれの「重要性」をどのように測定できますか?
これが回帰モデルである場合、「分散分析」F検定(lm
変数があるモデルとないモデルの間)からのp値を調べることができます。lm
しかし、rpart
オブジェクトに「分散分析」を使用することと同等ですか?
(私は私の質問を明確にすることができたと思います)
ありがとう。