私はいくつかのより大きなデータセットをクラスター化しようとしています。次元7の50000個の測定ベクトルで構成されています。さらに処理するために、約30〜300個のクラスターを生成しようとしています。
私は運が悪かった次のクラスタリングの実装を試してきました:
- Pycluster.kcluster(データセットに空でないクラスターを1〜2個だけ指定します)
- scipy.cluster.hierarchy.fclusterdata(実行時間が長すぎます)
- scipy.cluster.vq.kmeans(メモリ不足)
- sklearn.cluster.hierarchical.Ward(実行時間が長すぎます)
私が見逃すかもしれない他の実装はありますか?