2

pmml パッケージを使用して R 分類子を PMML にエクスポートしようとしているときに、ツリー内のノードのクラス分布がエクスポートされていないことに気付きました。

PMML は ScoreDistribution 要素でこれをサポートします: http://www.dmg.org/v1-1/treemodel.html

PMMLにこの情報を含める方法はありますか? この情報に依存する別のツールで PMML を読み取りたいと考えています。

私は次のようなことをしています:

library(randomForest)
library(pmml)

iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)
4

1 に答える 1

4

使用しようとしている機能など、さらに情報を提供できますか。

たとえば、randomForest パッケージを使用している場合、スコア分布に関する情報は提供されないと思います。したがって、PMML 表現もできません。ただし、デフォルト値を使用している場合、分類のパラメーター 'nodesize' は、たとえば 1 に等しくなり、これはターミナル ノードが次のような ScoreDistribution を持つことを意味します。

ScoreDistribution value=predictedValue 確率="1.0"/>

ScoreDistribution 値=AnyOtherTargetCategory 確率="0.0"/>

rpart ツリー モデルを使用している場合、pmml 関数はスコア分布情報を出力します。おそらく、使用した正確なコマンドを教えていただけますか?

于 2014-02-24T21:06:56.187 に答える