文字列値の属性に基づいて J48 ディシジョン ツリーをプロットし、ターゲット変数 (カテゴリ) を予測しようとしています。数値に基づいてディシジョン ツリーをプロットする多くの例を見てきましたが、文字列に基づいて遭遇したことはありません。
これがサンプル データ セットです。J48 ディシジョン ツリーは問題なく動作します。
library(RWeka)
library(party)
MyData2 <- read.csv(file="iris.csv", header=TRUE, sep=",")
m3 <- J48(species~ ., data = MyData2)`enter code here`
if(require("party", quietly = TRUE)) plot(m3)
sepal_length sepal_width petal_length petal_width species
5.1 3.5 1.4 0.2 setosa
4.9 3 1.4 0.2 setosa
7 3.2 4.7 1.4 versicolor
6.4 3.2 4.5 1.5 versicolor
6.3 3.3 6 2.5 virginica
5.8 2.7 5.1 1.9 virginica
ヘッダーの名前を sepal_length、sepal_width、および sepal_color に変更し、値を「白」、「黒」、色の組み合わせを setosa、versicolor、および virginca に変更した場合、決定木をプロットしてターゲット種の値を予測するにはどうすればよいですか。
以下のようなデータセットがあるとします。
sepal_color sepal_color petal_color petal_color species
white black white black setosa
white yellow white yellow versicolor
green brown green brown virginica