0

Twitterからのデータをクラスタリングしたい。ユーザーとその距離があります。k-meansは距離空間でのクラスタリングをサポートしていないため、K-meansを使用できません。距離空間でのクラスタリングの実装はありますか?

4

2 に答える 2

1

この問題に階層的クラスタリングを使用することを検討しましたか?

また、役立つかもしれないメトリック空間でのクラスタリングに関する一連の講義もここにあります: Clustering Large Datasets in Arbitrary Metric Spaces

メトリック空間でのクラスタリング

Java 用のクラスタリング パッケージを次に示します。

ML

kmeans

階層的クラスタリング

Cross Validation で役立つかもしれない質問がありました。彼らは Java を使用していませんが、彼らが提供した解決策が役立つかもしれません:距離行列によるクラスタリング

于 2013-02-19T20:07:25.807 に答える
1

真剣に、クラスター分析に関する本を入手してください。

There must be hundreds of clustering algorithms, many of which work on arbitrary spaces where you have some notion of similarity. As long as your notion of similarity is good, they can cluster the data. Most of the time they fail, your similarity doesn't work in the first place.

Anyway, your question is too broad to get you a good answer. You need to just try some of these hundred algorithms yourself.

于 2013-02-20T06:59:52.773 に答える