平面 (都市) に多くのポイント (緯度と経度) があり、2 つのクラスターを見つけたいと考えています。クラスター 1 は密集したポイントであり、クラスター 2 はそれ以外のすべてです。
問題の定義が正確でないことはわかっています。定義されている唯一のことは、正確に 2 つのクラスターが必要であるということです。N 個のポイントのうち、最終的にクラスター 1 またはクラスター 2 になる数は定義されていません。
主な目的は、互いに非常に近いポイントを特定し、それらを残りのポイント (より均等に分散している) から分離することです。
私が考えることができる最高のものは、次のアルゴリズムです。
1. For each point, Calculate the sum of the square distances to all other points.
2. Run the k-means with k=2 on these square distances
距離の 2 乗 (またはさらに高次) は、次元を上げるのに役立ちます。ただし、このアルゴリズムは都市の中心近くのポイントに偏ります。都市の端にクラスターを見つけるのは難しいでしょう。
この問題を回避する方法について何か提案はありますか? このアルゴリズムを改善するためのその他の提案