この問題についてグーグルで検索しましたが、このアルゴリズムを簡単かつ詳細に説明しているものが見つかりません。
たとえば、id3 アルゴリズムは枝刈りをまったく使用しないことがわかっているため、連続特性がある場合、予測の成功率は非常に低くなります。
C4.5 では継続的な特性をサポートするために枝刈りを使用していますが、これが唯一の理由ですか?
また、WEKAアプリケーションでは、信頼係数が予測の効率にどのように影響するかを正確に理解できません。信頼係数が小さいほど、アルゴリズムはより多くの剪定を行いますが、剪定と予測の精度との相関関係は何ですか? 剪定すればするほど、予測が良くなるか、悪くなるか?
ありがとう