0

平面 (都市) に多くのポイント (緯度と経度) があり、2 つのクラスターを見つけたいと考えています。クラスター 1 は密集したポイントであり、クラスター 2 はそれ以外のすべてです。

問題の定義が正確でないことはわかっています。定義されている唯一のことは、正確に 2 つのクラスターが必要であるということです。N 個のポイントのうち、最終的にクラスター 1 またはクラスター 2 になる数は定義されていません。

主な目的は、互いに非常に近いポイントを特定し、それらを残りのポイント (より均等に分散している) から分離することです。

私が考えることができる最高のものは、次のアルゴリズムです。

1. For each point, Calculate the sum of the square distances to all other points.
2. Run the k-means with k=2 on these square distances

距離の 2 乗 (またはさらに高次) は、次元を上げるのに役立ちます。ただし、このアルゴリズムは都市の中心近くのポイントに偏ります。都市の端にクラスターを見つけるのは難しいでしょう。

この問題を回避する方法について何か提案はありますか? このアルゴリズムを改善するためのその他の提案

4

2 に答える 2

1

クラスタ 1 のポイントは互いに近接しているため、密度ベースのクラスタリング アルゴリズムが役立つと思います。OPTICS アルゴリズムを試すことができます。これは DBSCAN に似ていますが、さまざまな密度を認識し、クラスターの数をユーザーが指定できます。

于 2013-07-11T04:03:10.710 に答える