5

私はウェブ上で多くの同様の質問に出くわしましたが、私が理解できる私の問題を解決するものを見つけることができませんでした。私の理解を助けるために、ここでいくつかの説明をいただければ幸いです。前もって感謝します!

それで、

[COEFF,SCORE,latent,tsquare] = princomp(X)

coeffの場合、列は成分分散の降順であると理解しています。しかし、答えが示す可能性があるものとして、主成分(PC)の重要性ではなく、変数(元のデータセット)の重要性を知っていますかcoeff。私が持っている変数の重要性をランク付けする方法はありますか?

多くの統計ソフトウェアがこれを実行できることを確認しました。これは、どの元の変数がプロットに最も貢献しているか、および過剰適合の問題を防ぐために削除できる変数を示しています。MatLabでこれを行う方法はありますか?

私の目的は、データを2Dプロットでプロットすることです。つまり、最も重要なコンポーネントの分散を保持するPC1とPC2を使用します。繰り返しになりますが、どの変数を保持し、どの変数を破棄する必要があるかをどのように知ることができますか?

誰かが私にこれを説明できますか?ありがとう!

4

1 に答える 1

2

視覚化のためにデータを2D平面に投影することだけを気にする場合は、必ず、各点の最初の2つの座標を取得してください。これらは、質問でSCORE言及した座標です。PC1PC2

ただし、誰が最も貢献しX2 つのコンポーネントかを知りたい場合は、絶対値が最大の最初の 2 つの列のエントリを見つける必要がありますPC1。の最初の 2 列はの要素の線形結合を表すため、と が生成されます。PC2COEFFCOEFFXPC1PC2

于 2013-01-21T06:09:39.580 に答える