hdbscan - HDBSCAN で出力結果を印刷する方法

Question

ASCII データがあり、HDBSCAN を使用してデータをクラスター化する必要があります。ラベルを取得しましたが、出力クラスターの結果、つまり hdbscan からの一意で分離された結果を出力する方法がわかりません。

スニペット:

import hdbscan
import numpy as np

datafile = "ascii.txt"

data = np.loadtxt(datafile, dtype = np.uint8)

clusterer = hdbscan.HDBSCAN(min_cluster_size = 20)

clusterer.fit(data)

print (np.unique(clusterer.labels_, return_counts = True))

score 0 · Accepted Answer

hdbscan のインポート

numpy を np としてインポート

データファイル = "ascii.txt"

データ = np.loadtxt(データファイル、dtype = np.uint8)

Modified_data=pd.DataFrame(データ)

クラスタラー = hdbscan.HDBSCAN (min_cluster_size = 20)

clusterer.fit(Modified_data)

Modified_data['Clusters']=clusterer.labels_

Modified_data は、「Clusters」という名前の列があり、各インスタンスに対応するクラスターが Clusters 列で指定される pandas データフレームを返します。要件に応じてこのデータフレームを操作できます

hdbscan - HDBSCAN で出力結果を印刷する方法

2 に答える 2

Related

Reference