0

各細胞株の生物学的複製のペアのピアソン相関係数を計算することにより、生物学的複製の品質をテストします。

A<-data.frame(A1=rnorm(100), A2=rnorm(100),
          A3=rnorm(100), B1=rnorm(100),
          B2=rnorm(100))

データの一部のケースには 2 つの反復があり、他のケースには 3 つの反復があり、欠損値は含まれていません。レプリケートを比較するためにそのようなプロットを取得するにはどうすればよいですか?

レプリケートの品質

4

2 に答える 2

1

考えられる方法の 1 つを次に示します。ただし、これを行うにはおそらくもっと簡潔な方法があります。

まず、どの列がどの列の複製であるかを調べます。

fullnames<-colnames(A)
basenames<-substr(fullnames,1,nchar(fullnames)-1)
repnum<-as.integer(substr(fullnames,nchar(fullnames),nchar(fullnames)))

相関行列を計算し、必要なデータを抽出します。

ca<-cor(A)
corMask<-upper.tri(ca) & basenames[col(ca)]==basenames[row(ca)]
corSub<-ca[corMask]
nameSub<-basenames[row(ca)[corMask]]
repnumSub<-apply(cbind(repnum[row(ca[corMask]],repnum[col(ca[corMask]]),1,paste,collapse="-")

次に、プロットを描きます。

require(ggplot2)
plotdata<-data.frame(name=nameSub,cor=corSub,replicas=repnumSub)
ggplot(plotdata,aes(x=name,y=cor,pch=replicas))+geom_point()

次のサンプル データ セットを使用すると、次のようになります。

set.seed(123)
A<-data.frame(A1=rnorm(100), A2=rnorm(100),A3=rnorm(100),
          B1=rnorm(100),B2=rnorm(100),
          C1=rnorm(100),C2=rnorm(100),C3=rnorm(100))

ここに画像の説明を入力

次に、色を追加したり、プロットの制限などを変更して、希望どおりに見せることができます。

于 2013-10-02T15:22:45.990 に答える
0

より良い表現は、ヒート マップを使用することをお勧めします。ヒート マップは、レプリケート間の相関関係を視覚化します。したがって、同じバッチからの複製は、他の細胞株よりもはるかに高い相関を示します。したがって、最終的には、ヒート マップのセルの対角線で 1.0 に近い値が表示されます。ヒート マップは、異なる細胞株からのレプリケート間の相関関係が低いことも示しています。このような描画機能を実行するにはheatmap.2、{gplot} パッケージから使用できます。

于 2013-10-02T14:42:45.897 に答える