大規模なスプレッドシートの PCA 分析を行っており、負荷に応じて PC を選択しています。私が読んだ限りでは、データの単位が異なるため、PCA 分析を実行する前に標準化が必須です。
関数はprcomp()
本質的に標準化を実行しますか?
私はヘルプファイルを読んでいprcomp()
て、引数の下にこれを見ましたprcomp()
:
scale. a logical value indicating whether the variables should be scaled to have
unit variance before the analysis takes place. The default is FALSE for
consistency with S, but in general scaling is advisable. Alternatively, a
vector of length equal the number of columns of x can be supplied. The
value is passed to scale.
「単位分散を持つ変数のスケーリング」は標準化を意味しますか?
現在、このコマンドを使用しています:
prcomp(formula = ~., data=file, center = TRUE, scale = TRUE, na.action = na.omit)
それは十分ですか?または、標準化の別のステップを実行する必要がありますか?
ありがとう、