rpart を使用して分類ツリーをプロットしようとしていますが、R にすべての変数が含まれていません。20 個のケースと 200 個の変数があります。私のデータは次のようになります。
data <- data.frame(y = c(rep(0, 10), rep(1, 10)), x1 = c(rnorm(20)), x2 = c(rnorm(20)+0.5), x3 = c(rnorm(20)-0.2))
ただし、x1 + x2 +x3 .... + x200 の場合。
私の変数値はすべてこれに似ています。非常に小さく、平均が 0.0005 前後のものもあります。分類木が必要で、y はバイナリなので、 method = "class" が必要です。
cart <- rpart(formula = y ~ ., data = data, method = "class")
入力すると
print(cart)
私は得る:
n= 20
node), split, n, deviance, yval
* denotes terminal node
1) root 20 5.958333 0.4583333
2) x50< 0.0005126315 16 2.437500 0.1875000 *
3) x50>=0.0005126315 8 0.000000 1.0000000 *
x50に従ってのみ分割する理由がわかりません。何が起こっているのかをプロットしてみました。
plot(cart)
次のプロットを取得しました: http://i.imgur.com/cCTa69a.png
何が起こっているのか、またはどうすればこれを修正できますか? とても有難い。