3 つのダイアグラム (i)、(ii)、(iii)は、2 つの数値属性 (x 軸と y 軸) と 2 つのクラス (円と正方形) を持つターゲット属性を持つトレーニング セットを示しています。
私は今、データ マイニング アルゴリズム (最近傍、単純ベイズ、決定木) がそれぞれの分類問題をどれだけうまく解決できるか疑問に思っています。
Naive Bayes (属性が無相関であるという単純な仮定を使用) は、(i) および (iii) よりも 2 番目の問題をうまく解決すると思います。これは、数値属性が互いに独立している傾向があるためです。