2

C4.5 ディシジョン ツリーで主な属性を選択するための「情報ゲイン」を計算するために使用されているパッケージを見つけたので、それらを使用して「情報ゲイン」を計算してみました。

しかし、各パッケージの計算結果は、以下のコードのように異なります。

> IG.CORElearn <- attrEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, dataUSE1, estimator = "InfGain")
> IG.RWeka     <- InfoGainAttributeEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, dataUSE1)
> IG.FSelector <- information.gain(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi,dataUSE1)

    > IG.CORElearn
       In_Temp    In_Humi     In_CO2    In_Illu      In_LP   Out_Temp   Out_Humi 
    0.04472928 0.02705100 0.09305418 0.35064927 0.44299167 0.01832216 0.05551973 
    > IG.RWeka
       In_Temp    In_Humi     In_CO2    In_Illu      In_LP   Out_Temp   Out_Humi 
    0.11964771 0.04340197 0.12266724 0.38963327 0.44299167 0.03831816 0.07705798 
    > IG.FSelector
             attr_importance
    In_Temp       0.08293347
    In_Humi       0.02919697
    In_CO2        0.08411316
    In_Illu       0.27007321
    In_LP         0.30705843
    Out_Temp      0.02656012
    Out_Humi      0.05341252

各パッケージの計算結果が異なるのはなぜですか?

4

0 に答える 0