PCA を使用して、180 次元の特徴空間を 3 つの主成分に縮小しました。その後、k-mean クラスタリングを使用して、PCA の 3 つの主成分に従ってデータをクラスタリングしました。
ウィキペディアで、データセットが共同で正規分布している場合、主成分が独立していることが保証されていることを読みました。すべてのフィーチャの共同分布 (180) を計算していませんでした...それは問題ですか?
次元削減に PCA を使用する際の仮定 (ある場合) またはベスト プラクティスはどれですか?