-1

基本的に次のようなRにロードされたdata.frame(DFと呼びましょう)があります:

         primary_variable     var1     var2     var3     var4...     var354
sample1      5                    1        4        3        2       1
sample2      8                    2        3        4        1       2
sample3      7                    3        2        1        4       3
sample4      2                    4        1        2        3       4
.
.
.
sample58     8                    1        2        3        4

基本的に、単純な線形回帰を複数回実行し、次のように主要変数と他のすべての変数を個別に比較します。

reg <- lm(primary_variable~var1, data=DF)
reg <- lm(primary_variable~var2, data=DF)
reg <- lm(primary_variable~var3, data=DF)
reg <- lm(primary_variable~var354, data=DF)

そして、データを何らかのテーブルに出力して、それらすべての P 値を読み取ることができるようにします。

これを行う最も簡単な方法は何ですか?

4

1 に答える 1

2

これを行う方法は次のとおりです。

DF <- read.table(text="         primary_variable     var1     var2     var3     var4
sample1      5                    1        4        3        2
sample2      8                    2        3        4        1
sample3      7                    3        2        1        4
sample4      2                    4        1        2        3", header=TRUE)

sapply(DF[,-1], function(x) summary(lm(DF[,1]~x))$coef[,"Pr(>|t|)"])

#                  var1     var2      var3     var4
# (Intercept) 0.1471971 0.477767 0.4023857 0.206388
# x           0.5120500 0.512050 0.7072300 0.707230

ただし、これを行わないことを強くお勧めします。統計学者に助けを求めてください。

于 2013-10-18T16:14:24.440 に答える