DBSCAN を使用して、Scikit-Learn (Python 2.7) を使用して一部のデータをクラスター化しています。
from sklearn.cluster import DBSCAN
dbscan = DBSCAN(random_state=0)
dbscan.fit(X)
ただし、元のデータ X で識別されたクラスターに新しいデータ ポイント Y を割り当てることができる組み込み関数 (「fit_predict」以外) がないことがわかりました。K 平均法には「予測」があります。関数ですが、DBSCANでも同じことができるようにしたいです。このようなもの:
dbscan.predict(X, Y)
そのため、密度は X から推測できますが、戻り値 (クラスター割り当て/ラベル) は Y に対してのみです。私が知る限り、この機能は R で利用できるため、Python でも何らかの形で利用できると思います。これに関するドキュメントが見つからないようです。
また、新しいデータのラベル付けに DBSCAN が使用されない理由を探してみましたが、正当な理由は見つかりませんでした。