10

Rで10000個のデータポイントと100個の変数のデータセットを使用しています。残念ながら、私が持っている変数はデータを適切に説明していません。を使用して PCA 分析を実行しましたがprcomp()、最初の 3 つの PC がデータの変動性のほとんどを説明しているようです。私の知る限り、主成分はさまざまな変数の組み合わせです。したがって、各データポイントに対応する特定の値を持ち、新しい変数と見なすことができます。これらの主成分を 3 つの新しい変数としてデータに追加できますか? さらなる分析のためにそれらが必要になります。

再現可能なデータセット:

set.seed(144)
x <- data.frame(matrix(rnorm(2^10*12), ncol=12))
y <- prcomp(formula = ~., data=x, center = TRUE, scale = TRUE, na.action = na.omit)
4

2 に答える 2

0

Didzis Elferts の応答は、データ にxNA がない場合にのみ機能します。データに NA がある場合にコンポーネントを追加する方法を次に示します。

library(tidyverse)

components <- y$x %>% rownames_to_column("id")

x <- x %>% rownames_to_column("id") %>% left_join(components, by = "id")
于 2020-07-31T02:09:46.707 に答える