0

JavaでWeka APIを使用して、J48アルゴリズムで代替の欠損値処理を実装するのを手伝ってくれる人はいますか?

J48 をトレーニングする前に事前代入アプローチを使用するのは簡単だと確信しています。

しかし、既知の値を持つ観察されたケースから確率分布全体にケースを分割する J48 標準アプローチ (C4.5 の Quinlan) の代わりに、トレーニング日付 (CART で Breiman が行うように) を分割する場合に代理分割属性を使用することについてはどうでしょうか。

標準をサロゲート分割に置き換えるために、Weka API とソース コードのどこを変更する必要があるか、情報、ヒント、ヘルプを教えてもらえますか?

4

1 に答える 1

1

weka ソース コードweka.classifiers.trees.j48.C45ModelSelectionの 152 行目 (分割する「最適な」属性を見つけます) を見てください。分割基準として情報ゲイン比を使用します。

于 2014-07-08T17:52:31.567 に答える