私はウェブ上で多くの同様の質問に出くわしましたが、私が理解できる私の問題を解決するものを見つけることができませんでした。私の理解を助けるために、ここでいくつかの説明をいただければ幸いです。前もって感謝します!
それで、
[COEFF,SCORE,latent,tsquare] = princomp(X)
coeff
の場合、列は成分分散の降順であると理解しています。しかし、答えが示す可能性があるものとして、主成分(PC)の重要性ではなく、変数(元のデータセット)の重要性を知っていますかcoeff
。私が持っている変数の重要性をランク付けする方法はありますか?
多くの統計ソフトウェアがこれを実行できることを確認しました。これは、どの元の変数がプロットに最も貢献しているか、および過剰適合の問題を防ぐために削除できる変数を示しています。MatLabでこれを行う方法はありますか?
私の目的は、データを2Dプロットでプロットすることです。つまり、最も重要なコンポーネントの分散を保持するPC1とPC2を使用します。繰り返しになりますが、どの変数を保持し、どの変数を破棄する必要があるかをどのように知ることができますか?
誰かが私にこれを説明できますか?ありがとう!