2

3 つのダイアグラム (i)、(ii)、(iii)ここは、2 つの数値属性 (x 軸と y 軸) と 2 つのクラス (円と正方形) を持つターゲット属性を持つトレーニング セットを示しています。

私は今、データ マイニング アルゴリズム (最近傍、単純ベイズ、決定木) がそれぞれの分類問題をどれだけうまく解決できるか疑問に思っています。

Naive Bayes (属性が無相関であるという単純な仮定を使用) は、(i) および (iii) よりも 2 番目の問題をうまく解決すると思います。これは、数値属性が互いに独立している傾向があるためです。

4

1 に答える 1

9

このようなシナリオで指定された各メソッドを使用する場合:

最初の 1 つは、 cos クラスを軸で分離できるデシジョン ツリーアプローチで最もよく解決できます。つまり、値を左右に分ける x 軸に垂直な線を引き、y 軸に垂直な別の線を引くと、クラスが適切に分離されることがわかります。

あなたが言及したように、 2番目のものは単純ベイズ問題と見なすことができます。

3 つ目は、 k 最近傍アプローチで解決できます。正方形のクラスは座標系上の近い位置にあり、円のクラスも多少の誤差はありますが分類できます。

于 2013-02-25T18:31:38.530 に答える