43

DBSCAN を使用して、Scikit-Learn (Python 2.7) を使用して一部のデータをクラスター化しています。

from sklearn.cluster import DBSCAN
dbscan = DBSCAN(random_state=0)
dbscan.fit(X)

ただし、元のデータ X で識別されたクラスターに新しいデータ ポイント Y を割り当てることができる組み込み関数 (「fit_predict」以外) がないことがわかりました。K 平均法には「予測」があります。関数ですが、DBSCANでも同じことができるようにしたいです。このようなもの:

dbscan.predict(X, Y)

そのため、密度は X から推測できますが、戻り値 (クラスター割り当て/ラベル) は Y に対してのみです。私が知る限り、この機能は R で利用できるため、Python でも何らかの形で利用できると思います。これに関するドキュメントが見つからないようです。

また、新しいデータのラベル付けに DBSCAN が使用されない理由を探してみましたが、正当な理由は見つかりませんでした。

4

7 に答える 7