2

各クラスターの最小ボリューム境界楕円体を構築するためにクラスター化する必要がある 4 次元データがあります。単一の点で楕円体の信頼領域を構築できないため、単一の点のクラスター、または少なくとも、可能な限り少ない数の単一の点のクラスターを持ちたくありません。私の問題では、クラスターの数は事前に与えられていません。だから私は Scikit-learn のアフィニティ伝播 - http://scikit-learn.org/stable/modules/clustering.html#affinity-propagationを使用してクラスターの数を推定し、データからクラスタリングを実行しています。しかし、このアプローチにより、非常に多くの単一点クラスターが得られます。この問題を解決する方法について洞察を与えることができますか?

PS : さらに詳しい情報を提供するために、ベイジアン証拠計算のための楕円体のネストされたサンプリングに取り組んでいます。

4

2 に答える 2

1

Affinity Propagation を主張するかどうかはわかりませんが、DBSCAN を使用すると、eps と minPts のアルゴリズム パラメーターによって目的を達成できます。

eps が大きいほど、密度の低いクラスターが検出され、近くのクラスターもマージされることを意味します。

minPts が大きいほど、より多くのデータをノイズとしてマークすることになります。

于 2014-07-09T13:12:23.867 に答える