WekaのC4.5(J48)デシジョンツリーで欠落している機能属性値を処理するための最良の方法は何ですか?欠測値の問題は、トレーニングと分類の両方で発生します。
トレーニングインスタンスから値が欠落している場合、「?」を配置すると想定して正しいですか?機能の価値は?
デシジョンツリーを正常に構築し、Wekaのツリー構造からC++またはJavaで独自のツリーコードを作成できるとします。分類時に、新しいインスタンスを分類しようとしている場合、値が欠落しているフィーチャにどのような値を設定しますか?値が不明な決定ノードを超えてツリーを下るにはどうすればよいですか?
欠測値を処理するには、ナイーブベイズを使用する方がよいでしょうか?私はそれらに非常に小さな非ゼロの確率を割り当てるだけですよね?