0

scikit Learnで構築したNaive Bayesモデル用の独自のpmmlエクスポーターを構築しようとしています。PMMLのドキュメントを読むと、各特徴ベクトルについて、離散の場合はカウントデータで、連続の場合はガウス/ポアソン分布としてモデルを出力できるようです。しかし、私の scikit 学習モデルの係数は、特徴の経験的対数確率、つまり p(y|x_i) に基づいています。カウントではなく、これらの確率に関してベイズ入力パラメーターを指定することは可能ですか?

4

1 に答える 1

1

Naive Bayes モデルの PMML 表現は、"PairCounts" 要素を介して結合確率を表すことを実装しているため、その比率を (対数確率ではなく) 確率出力に単純に置き換えることができます。最終的な確率は正規化されているため、違いは問題になりません。ほとんどが 0 である多数の確率が要件に含まれる場合、モデルの「しきい値」属性を使用して、そのような確率のデフォルト値を設定できます。

于 2014-12-08T23:12:19.147 に答える