0

データマイニングアルゴリズムを適用し始めました。今は決定木を勉強しています。C4.5 および ID3 アルゴリズムに関する資料はインターネット上にたくさんありますが、これら 2 つのアルゴリズムの実用的な詳細、長所と短所、および技術的な優れた点を知りたいです。そのような資料へのリンクがあれば嬉しいです

4

1 に答える 1

3

デシジョン ツリーの 2 つの利点は、ノイズの多いデータを処理できることと、データを直感的に解釈できることです (ツリーで最も重要と見なされる属性を簡単に確認できます)。短所は、貪欲なアルゴリズム (最終的な分類精度にどのように影響するかを考慮せずに分岐属性を選択する) であるため、必ずしも最適なツリー構造が得られるとは限らないことです。決定木は、ランダム フォレストなどのアンサンブル手法に簡単に組み込むことができます。

C4.5 は ID3 の改善であり、実数値の属性 (ID3 はカテゴリ属性を使用) と欠落した属性を処理できるようにします。インターネット上には、両方のアルゴリズムに関する多くの説明があります。ウィキペディアには、ID3C4.5の両方の説明があります。両方のアルゴリズムの別の説明については、ここから始めることができます。

于 2012-12-03T14:49:03.243 に答える