2

私は Weka の属性選択機能を Information Gain に使用しており、Weka が連続データを処理する際に使用する特定の式を理解しようとしています。

エントロピーの通常の式は、データの値が離散的である場合のこれであることを理解しています。連続データを扱う場合、差分エントロピーを使用するか、値を離散化できることを理解しています。InfoGainAttributeEvalに対する Weka の説明を調べてみましたが、他の多くの参照を調べましたが、何も見つかりません。

たぶん私だけかもしれませんが、Wekaがこのケースをどのように実装するか知っている人はいますか?

ありがとう!

4

1 に答える 1

1

著者のマーク・ホールに尋ねたところ、彼は次のように述べています。

Fayad と Irani の教師あり MDL ベースの離散化手法を使用します。javadoc を参照してください:
http://weka.sourceforge.net/doc.stable-3-8/weka/attributeSelection/InfoGainAttributeEval.html

また、離散化方法については、次のリンクを参照してください。

http://weka.sourceforge.net/doc.stable-3-8/weka/filters/supervised/attribute/Discretize.html

于 2016-08-29T20:44:00.973 に答える