私はエントロピーを計算するための公式を知っています:
H(Y) = - ∑ (p(yj) * log2(p(yj)))
つまり、属性を選択し、値ごとにターゲット属性値を確認します...したがって、p(yj)は、ノードNのパターンの割合がカテゴリyjにあることを示します。1つはターゲット値でtrue、もう1つはfalseです。
しかし、ターゲット属性が価格、つまり範囲であるデータセットがあります。この種のデータセットのエントロピーを計算する方法は?
(参照:http ://decisiontrees.net/decision-trees-tutorial/tutorial-5-exercise-2/ )