r - ペアワイズ相関表

Question

私はRを初めて使用するので、これが簡単な質問である場合は申し訳ありませんが、今晩かなりの検索を行ったので、それを理解できないようです. 多数の変数を含むデータフレームがあります。私がやりたいのは、これらのサブセット間の相関関係のテーブルを作成することです。基本的には、Stata の「pwcorr」または「correlations」に相当します。 SPSS。これに対する 1 つの鍵は、r が必要なだけでなく、その値に関連付けられた有意性も必要だということです。

何か案は？これは非常に単純なはずですが、良い方法がわかりません。

score 10 · Accepted Answer

Bill Venables は、R メーリングリストからのこの回答でこのソリューションを提供しています。

cor.prob <- function(X, dfr = nrow(X) - 2) {
  R <- cor(X)
  above <- row(R) < col(R)
  r2 <- R[above]^2
  Fstat <- r2 * dfr / (1 - r2)
  R[above] <- 1 - pf(Fstat, 1, dfr)

  cor.mat <- t(R)
  cor.mat[upper.tri(cor.mat)] <- NA
  cor.mat
}

それでは、テストしてみましょう。

set.seed(123)
data <- matrix(rnorm(100), 20, 5)
cor.prob(data)

          [,1]      [,2]      [,3]      [,4] [,5]
[1,] 1.0000000        NA        NA        NA   NA
[2,] 0.7005361 1.0000000        NA        NA   NA
[3,] 0.5990483 0.6816955 1.0000000        NA   NA
[4,] 0.6098357 0.3287116 0.5325167 1.0000000   NA
[5,] 0.3364028 0.1121927 0.1329906 0.5962835    1

それはcor.testと一致していますか？

cor.test(data[,2], data[,3])

 Pearson's product-moment correlation
data:  data[, 2] and data[, 3] 
t = 0.4169, df = 18, p-value = 0.6817
alternative hypothesis: true correlation is not equal to 0 
95 percent confidence interval:
 -0.3603246  0.5178982 
sample estimates:
       cor 
0.09778865

うまくいくようです。

score 4 · Accepted Answer

R パッケージの picante が、あなたが抱えている問題をうまく処理してくれることがわかりました。データセットを cor.table 関数に簡単に渡して、すべての変数の相関と p 値のテーブルを取得できます。関数で Pearson の r または Spearman を指定できます。ヘルプについては、次のリンクを参照してください: http://www.inside-r.org/packages/cran/picante/docs/cor.table

また、関数を実行する前に、数値以外の列をデータセットから削除することを忘れないでください。コードの例を次に示します。

install.packages("picante")
library(picante)
#Insert the name of your dataset in the code below
cor.table(dataset, cor.method="pearson")

score 4 · Accepted Answer

これは私が作成したばかりのものです。変数のすべてのペアを取り、きちんとした nX3 データフレームを取得する方法を探していたので、この投稿に出くわしました。列 1 は変数、列 2 は変数、列 3 と 4 はそれらの絶対値と真の相関関係です。関数に数値と整数値のデータフレームを渡すだけです。

  pairwiseCor <- function(dataframe){
  pairs <- combn(names(dataframe), 2, simplify=FALSE)
  df <- data.frame(Vairable1=rep(0,length(pairs)), Variable2=rep(0,length(pairs)), 
                   AbsCor=rep(0,length(pairs)), Cor=rep(0,length(pairs)))
  for(i in 1:length(pairs)){
    df[i,1] <- pairs[[i]][1]
    df[i,2] <- pairs[[i]][2]
    df[i,3] <- round(abs(cor(dataframe[,pairs[[i]][1]], dataframe[,pairs[[i]][2]])),4)
    df[i,4] <- round(cor(dataframe[,pairs[[i]][1]], dataframe[,pairs[[i]][2]]),4)
  }
  pairwiseCorDF <- df
  pairwiseCorDF <- pairwiseCorDF[order(pairwiseCorDF$AbsCor, decreasing=TRUE),]
  row.names(pairwiseCorDF) <- 1:length(pairs)
  pairwiseCorDF <<- pairwiseCorDF
  pairwiseCorDF
  }

出力は次のとおりです。

 > head(pairwiseCorDF)
             Vairable1        Variable2 AbsCor     Cor
    1        roll_belt     accel_belt_z 0.9920 -0.9920
    2 gyros_dumbbell_x gyros_dumbbell_z 0.9839 -0.9839
    3        roll_belt total_accel_belt 0.9811  0.9811
    4 total_accel_belt     accel_belt_z 0.9752 -0.9752
    5       pitch_belt     accel_belt_x 0.9658 -0.9658
    6 gyros_dumbbell_z  gyros_forearm_z 0.9491  0.9491

score 3 · Accepted Answer

sjPlot-packagesjt.corrの関数を使用すると、適切にフォーマットされた相関テーブルが提供され、Office アプリケーションですぐに使用できます。

最も単純な関数呼び出しは、データフレームを渡すだけです。

sjt.corr(df)

ここで例を参照してください。

r - ペアワイズ相関表

4 に答える 4

Related

Reference