GMM に従ってクラスター データにラベルを付けようとしていますが、それを行う方法が見つかりません。
説明させてください:
X=30000x2 配列にいくつかの x、y データ ペアがあります。実際には、配列にはさまざまなソース (既知) からのデータが含まれており、各ソースには同じ数のデータがあります (つまり、ソース 1 には 500 (x,y)、ソース 2 には 500 (x,y) があり、それらはすべて上記の X 配列に追加されます)。
X に GMM を取り付けました。クラスターの結果は問題なく、期待どおりですが、データがクラスター化されたので、最初の起源に基づいて色分けできるようにしたいと考えています。
では、クラスタ 2 にあるソース 1 のデータ ポイントを黒で表示したいとします。
それは可能ですか?
例: 元の配列には、データのソースが 3 つあります。ソース 1 は 1 ~ 10000、ソース 2 は 10001 ~ 20000、ソース 3 は 20001 ~ 30000 のデータです。
GMM フィッティングとクラスタリングの後、図 1 に従ってデータをクラスタ化し、2 つのクラスタを取得しました。それらすべての赤い色は無関係です。
インデックスと元の配列 XEg に基づいてクラスター 2 のデータ ポイントの色を変更したい。データ ポイントがクラスター 2 (clusteridx=2) に属している場合、それが属するソースを確認してから色を付けたいそれに応じてラベルを付けます。これにより、2 番目の図に示すように、クラスター 2 のデータ ポイントがどのソースからのものかがわかります。
元のクラスター
希望するラベリング