私はヘルスケアで働いており、R の使い方について助けが必要です。私は説明します: 私はそのようなデータのセットを持っています:
S1 S2 S3 S4 S5
0.498 1.48 1.43 0.536 0.548
2.03 1.7 3.74 2.13 2.02
0.272 0.242 0.989 0.534 0.787
0.986 2.03 2.53 1.65 2.31
0.307 0.934 0.633 0.36 0.281
0.78 0.76 0.706 0.81 1.11
0.829 2.03 0.667 1.48 1.42
0.497 1.27 0.952 1.23 1.73
0.553 0.286 0.513 0.422 0.573
ここに私の目的があります:
Do correlation between every column
Calculate p-values
Calculate R-squared
Only show when R2>0.5 and p-values <0.05
これまでの私のコードは次のとおりです(最も効率的ではありませんが、機能します):
> e<-read.table(‘Workbook8nm.csv’, header=TRUE, sep=“,”, dec=“.”, na.strings=“NA”)
> f<-data.frame(e)
> M<-cor(f, use=“complete”) #Do the correlation like I want
> library(‘psych’)
> N<-corr.test (f) #Give me p-values
したがって、これまでのところ、M に相関関係があり、N に p 値があります。R2 を表示する方法について助けが必要ですか?
そして2番目の部分は、たとえばR2> 0.5およびp値<0.05の場合にのみRを表示する方法ですか? 私はこの行を使用しました:
P<-M[which(m>0.9))]
トレーニングとして、ピアソン係数が 0.9 を超える場合のみ表示します。しかし、それは 0.9 よりも優れたすべての値のリストを作成するだけです...したがって、この係数がどの列とどの列から来たのかわかりません。最良の方法は、列の名前を持つテーブルに重要な値を表示して、簡単に識別できるようにすることです。私がそれをしたい理由は、テーブルごとに 570 x 570 であるため、重要なものだけを保持するためにすべての p 値を調べることができないからです。
私が明確だったことを願っています!初めての投稿です、何か間違っていたら教えてください!
ご協力いただきありがとうございます !