相関性の高い 4 つの変数 (0.85) があるため、K-means アルゴリズムでマハラノビス距離を使用したいと思います。
この場合、マハラノビス距離を使用する方が良いようです。
問題は、K-means アルゴリズムを使用して R に実装する方法がわからないことです。
クラスタリングステップの前にデータを変換する際に「偽造」する必要があると思いますが、方法がわかりません。
標準化データのユークリッド距離を使用して、古典的なkmeansを試しましたが、前述のように、相関が多すぎます。
フィット <- kmeans(mydata.standardize, 4)
距離パラメーターも見つけようとしましたが、 kmeans() 関数には存在しないと思います。
期待される結果は、マハラノビス距離で K-means アルゴリズムを適用する方法です。