0

ラプラス平滑化も使用すると、負の情報利得を得ることができますか?

私たちは知っています:

IG = H(Y) - H(Y|X)

ここで、H はエントロピー関数、IG は情報ゲインです。

また:

H(Y) = -Σy P(Y= y ).log 2 (P(Y=y))

H(Y|X) = Σ × P(X=x).H(Y|X=x)

H(Y|X=x) = -Σy P(Y= y |X=x).log 2 (P(Y=y|X=x))

たとえば、 P(Y=y|X=x) = n y|x /n xとします。しかし、n x = 0 かつ n y|x = 0 である可能性もあります。したがって、ラプラス平滑化を行い、P(Y=y|X=x) = (n y|x +1)/(n x +| X |))。ここで |X| X が取り得る可能な値の数を示します (X が属性として選択された場合に可能な分割の数)。ラプラス平滑化により、負の情報が得られる可能性はありますか?

4

0 に答える 0