トレーニング データセットをクラスタリング モデルに提供する前に、StandardScaler を使用してデータを変換しています。
X = StandardScaler().fit_transform(X_train)
clf が教師なしクラスター モデルであると仮定すると、次のようにラベルを予測しています。
y = clf.predict(X)
質問: "y" と "X_train" numpy 配列を組み合わせるにはどうすればよいですか? StandardScaler() がマトリックス内の順序を維持しているかどうかはわかりません。それで、これはうまくいきますか?
df = pd.DataFrame(np.array(X_train), np.array(y))