2

R の初心者として、提供された「car.test.frame」データセットを使用して、国に基づいて走行距離を予測する分類ツリーを作成します。入力したコマンドは次のとおりです。

> z.auto <- rpart(Mileage ~ Country, car.test.frame, method="class")
> plot(z.auto)
> text(z.auto)   

これにより、次のツリーが作成されました。 マイレージの分類ツリー

ご覧のとおり、最上位レベルでは、Country=cegh が最初の分割を提供し、Country=egh が 2 番目の分割を提供します。実際の国名を反映するように変更するにはどうすればよいですか? そして、実際にチャートをどのように理解するのでしょうか?

4

1 に答える 1

0

興味深い質問です。Andrie de Vries という名前の別の人は、今年出てきた ggplot を使用してこのタイプのプロットを視覚化するためのパッケージを開発したため、同様の問題に直面したようです。問題を解決するには、ggdendroをダウンロードしてください。きれいな写真を見るには、ビネットを参照してください。

fitr <- dendro_data(z.auto)
fitr$labels$label<- c("Country= Japan,Korea,Sweden,USA", "Country= Korea,Sweden,USA")
ggplot() +
  geom_segment(data=fitr$segments, aes(x=x, y=y, xend=xend, yend=yend)) +
  geom_text(data=fitr$labels, aes(x=x, y=y, label=label)) +
  geom_text(data=fitr$leaf_labels, aes(x=x, y=y, label=label)) +
  theme_dendro()
于 2015-12-22T17:24:52.680 に答える