3

私は機械学習にまったく慣れておらず、次元削減法として主成分分析を紹介したばかりです。モデルからいくつかの機能を単純に削除するよりも、PCAの方が優れているのはどのような状況ですか? より低次元のデータを取得することが目的である場合、相関関係のある特徴をグループ化し、各グループから 1 つの特徴を保持しないのはなぜでしょうか?

4

1 に答える 1

3

機能削減(PCA など) と機能選択(説明)には根本的な違いがあります。重要な違いは、特徴削減 (PCA) は、すべての元の次元の投影を通じてデータをより低い次元にマッピングすることです。たとえば、PCA はそれぞれの線形結合を使用します。したがって、最終的なデータの埋め込みには、すべての機能からの情報が含まれます。情報を破棄する機能選択を実行すると、そこに存在していたものはすべて完全に失われます。さらに、PCA は、データ分散の特定の割合を保持することを保証します。

于 2015-11-19T23:19:56.553 に答える