距離行列を入力として使用できるクラスタリングアルゴリズムを誰かが提案できますか?または、距離行列にも基づいてクラスタリングの「良さ」を評価できるアルゴリズムですか?
現在、クラスカルのアルゴリズム(http://en.wikipedia.org/wiki/Kruskal%27s_algorithm)の変更を使用して、データを2つのクラスターに分割しています。しかし、問題があります。データに個別のクラスターがない場合でも、アルゴリズムは2つのクラスターを作成し、1つのクラスターには1つの要素が含まれ、もう1つのクラスターには残りのすべてが含まれます。この場合、すべての要素を含む1つのクラスターと、空の別のクラスターが必要です。
このタイプのクラスタリングを実行できるアルゴリズムはありますか?
クラスタリングがどの程度うまく行われたか、またはデータにクラスターがいくつあるかをさらに正確に推定できるアルゴリズムはありますか?
アルゴリズムは、入力として距離(類似度)行列でのみ機能する必要があります。