私は2つの集団を区別しようとしています。各母集団はNxM行列であり、Nは2つの間に固定され、Mは長さが可変です(N =各実行の列固有の属性、M =実行番号)。2つを区別するためにPCAとK-meansを見てきましたが、ベストプラクティスに興味がありました。
私の知る限り、K-means法では、既知のバイモーダル母集団を区別できるようにクラスターを選択する初期の「キャリブレーション」はありません。距離を最小化し、データを任意の数の母集団に割り当てるだけです。クラスタリングアルゴリズムに、2つの母集団が分離されている最適なものが必要であることを伝えたいと思います。その後、将来のデータセットで最初のクラスタリングから得た近似を使用できます。ヘルプ、サンプルコード、または読み物をいただければ幸いです。
-R