1

j48 ツリー アルゴリズムを使用してデータセットをマイニングしています。

useLaplaceパラメータの機能を理解しようとしています。私が行かなければならない唯一のことはこれです:

LapLace に基づいて葉の数を平滑化するかどうか

これは、WEKA が提供したドキュメントにすぎません。ただし、これについていくつか質問があります。

  1. 葉の数とは?
  2. スムージングとは?
  3. ラップレースとは?平滑化に使用されるアルゴリズムですか?

私がオンラインで見つけたものはすべて、このパラメーターが実際に何をしているのかについて詳しく説明していません。むしろ、「ラプラス平滑化をオンにする」と説明しているだけです。

4

1 に答える 1

2

Provost と Domingos は、ラプラス補正などのリーフ確率推定の周波数平滑化によって、決定木のパフォーマンスが大幅に向上することを発見しました。私が読んだことから、葉でのカウント(前の文の別名葉確率)は、次のように定義できる確率的推定を決定するために使用されます。

P( クラス A になる | 属性 x) = TruePositive/(TruePositive + FalsePositive)

平滑化は、より正確な確率的推定を生成するために、ツリー内の結果のノイズとエラーを削減することにあります。

Laplace は周波数平滑化補正式です。

PLaplace ( クラス A | 属性 x の場合)= (TP + 1)/(TP + FP + C)

ここで、C はデータセット内のクラスの数です。

于 2016-03-02T11:25:21.213 に答える