MLlib を使用してディシジョン ツリー用に Spark 1.0 または 1.1 を実行しています。
サンプル データでサンプル SCALA コードを実行すると、エラーは発生しませんでしたが、結果から機能の重要性を見つけることができませんでした。
値を取得する方法について、そのような情報を持っている人はいますか?
MLlib を使用してディシジョン ツリー用に Spark 1.0 または 1.1 を実行しています。
サンプル データでサンプル SCALA コードを実行すると、エラーは発生しませんでしたが、結果から機能の重要性を見つけることができませんでした。
値を取得する方法について、そのような情報を持っている人はいますか?
最後に DecisionTreeModel をトレーニングすると、このクラスがあります
class DecisionTreeModel(val topNode: Node, val algo: Algo) {
...
}
上からノードのトラバースを開始でき、そこから必要なすべてを取得できます (予測 + InformationGainStats)
class Node (
val id: Int,
val predict: Double,
val isLeaf: Boolean,
val split: Option[Split],
var leftNode: Option[Node],
var rightNode: Option[Node],
val stats: Option[InformationGainStats])