Rで10000個のデータポイントと100個の変数のデータセットを使用しています。残念ながら、私が持っている変数はデータを適切に説明していません。を使用して PCA 分析を実行しましたがprcomp()
、最初の 3 つの PC がデータの変動性のほとんどを説明しているようです。私の知る限り、主成分はさまざまな変数の組み合わせです。したがって、各データポイントに対応する特定の値を持ち、新しい変数と見なすことができます。これらの主成分を 3 つの新しい変数としてデータに追加できますか? さらなる分析のためにそれらが必要になります。
再現可能なデータセット:
set.seed(144)
x <- data.frame(matrix(rnorm(2^10*12), ncol=12))
y <- prcomp(formula = ~., data=x, center = TRUE, scale = TRUE, na.action = na.omit)