0

決定木がテスト セットにどのように適用されるかを視覚化しようとしており、Weka の J48 決定木を使用しています。Weka は、決定木を評価してリーフに到達することにより、各サンプルをクラスで識別します。もちろん、複数の葉には同じクラスがタグ付けされています。各サンプルについて、そのサンプルのタグ付けに使用された葉を Weka に伝える方法を知っている人はいますか?

X < 47
|  Y > 10  : Class1 (...)
|  Y <= 10 : Class2 (...)
X >= 47
|  Y > 15  : Class1 (...)
|  Y <= 15
|  |  Z > 10  : Class2 (...)
|  |  Z <= 10 : Class1 (...)

「(X>=47, Y<=15, Z<=10) のため、サンプル 15 は Class1 に分類されました」などのようなものが欲しいです。

あるいは、「(X>=47, Y<=15, Z<=10) のため、27 個のサンプルが Class1 に分類されました」というようなものが欲しいです。

あるいは、誰かがこの情報を視覚化した事例や、この情報を吐き出す他のソフトウェアを知っている人はいますか? ありがとう。

4

1 に答える 1

0

本当の答えを知っている人がいれば、私はまだ本当の答えを求めていますが、私の答えは、Wekaにはこの能力が含まれていないということです. 私の解決策は、私が必要とするものを作ることです。ここから入手できます:

GitHub:DecisionTreeDNA

まだ終わっていません。数値を使用してクールなグラフを作成しようとしていますが、必要な数値をすでに吐き出しています。ああ、吐き出す数字は「(X>=47, Y<=15, Z<=10) ため、27 個のサンプルが Class1 に分類された」種類のものですが、吐き出すように変更するのは簡単です「サンプル 15 は分類されました」 (X>=47, Y<=15, Z<=10)" であるため、Class1 として。

于 2012-12-14T23:43:15.170 に答える