1

2つの従属連続変数があり、それらを組み合わせた値を使用して、3番目のバイナリ変数の値を予測したいと思います。値を離散化/分類するにはどうすればよいですか?私はクラスタリングアルゴリズムを探していません。ベイズ分類器で後で使用できる「意味のある」個別のカテゴリを取得することに特に興味があります。論文、本、オンラインコースへのポインタ、すべて非常に感謝しています!

4

2 に答える 2

0

本当のオタクになりたい場合は、さまざまな可能な離散化を生成し、その上で分類器をトレーニングしてから、機能によって離散化を特徴付け、その上で分類子を実行して、どのような種類の離散化が最適かを確認してください!?

一般に、ものを離散化することは芸術であり、入力変数の範囲が何を意味するかをよく理解しています。

于 2012-05-08T19:11:07.197 に答える
0

それが機械学習の本質であり、最も研究されている問題の 1 つです。

最小二乗回帰、ロジスティック回帰、SVM、ランダム フォレストは、バイナリ分類と呼ばれるこの種の問題に広く使用されています。

データを実用的に分類することが目標の場合は、Python の Scikits-learn や Java の weka など、いくつかのライブラリを利用できます。彼らは素晴らしいドキュメントを持っています。

しかし、機械学習の本質を理解したい場合は、(ここまたは Google で) 機械学習リソースを検索してください。

于 2012-05-08T12:41:18.010 に答える