入力として距離行列を取り、各要素がクラスター内の他の各要素から最大「x」距離離れたクラスターを返す、オープン/フリー密度ベースのクラスター化ライブラリを見つけるのに助けが必要です (基本的に、指定された密度のクラスターを返します)。 .
DBSCAN アルゴリズムをチェックアウトしましたが、私のニーズに合っているようです。事前に計算された距離行列で離陸し、目的の密度でクラスターを出力できる DBSCAN のクリーンな実装はありますか?
あなたの意見は本当に役に立ちます。
入力として距離行列を取り、各要素がクラスター内の他の各要素から最大「x」距離離れたクラスターを返す、オープン/フリー密度ベースのクラスター化ライブラリを見つけるのに助けが必要です (基本的に、指定された密度のクラスターを返します)。 .
DBSCAN アルゴリズムをチェックアウトしましたが、私のニーズに合っているようです。事前に計算された距離行列で離陸し、目的の密度でクラスターを出力できる DBSCAN のクリーンな実装はありますか?
あなたの意見は本当に役に立ちます。
ELKI ( http://elki.dbs.ifi.lmu.de/ ) は、外部距離行列をバイナリ形式またはアスキー形式で読み込んで、距離ベースのクラスタリング アルゴリズムを実行できます。
ただし、k-means などの特定のアルゴリズムは機能しません。これは、明らかに事前計算されていない /mean/ までの距離に依存するためです。しかし、たとえば DBSCAN と OPTICS は、事前に計算された距離でうまく機能します。
Matlab ファイル交換には、 事前計算された行列に簡単に適応できる実装があります。pdist1コード内の関数の外側への呼び出しを削除するだけです。
まだ試していませんが、似たようなものを探していて、DBSCAN のこの python 実装に出くわしました:
http://scikit-learn.org/dev/auto_examples/cluster/plot_dbscan.html#example-cluster-plot-dbscan-py