私は Weka の属性選択機能を Information Gain に使用しており、Weka が連続データを処理する際に使用する特定の式を理解しようとしています。
エントロピーの通常の式は、データの値が離散的である場合のこれであることを理解しています。連続データを扱う場合、差分エントロピーを使用するか、値を離散化できることを理解しています。InfoGainAttributeEvalに対する Weka の説明を調べてみましたが、他の多くの参照を調べましたが、何も見つかりません。
たぶん私だけかもしれませんが、Wekaがこのケースをどのように実装するか知っている人はいますか?
ありがとう!