r - R - データフレームの行の値に基づいて列のサブセットを作成する方法

Question

サブセット化し、最終的にプロットを作成するために使用したいマトリックスがあります。データは、集団内の各患者の特定の血液マーカーのカウントのリストです。次のようになります。

    df <- data.frame(MarkerID=c("Class","A123","A124"),
             MarkerName=c("","X","Y"),
             Patient.1=c(0,1,5),
             Patent.2=c(1,2,6),
             Patent.3=c(0,3,7),
             Patient.4=c(1,4,8))

クラス値がゼロ（1行目）のすべての患者（列3〜6）のデータフレームと、クラス値が1のすべての患者の2番目のデータフレームを作成したいと思います。

過去に、サブセット関数を使用して列の値に基づいて行を選択しましたが、行の値に基づいて列のサブセットを選択することは可能ですか?

私はこれを試しました：

x <- subset(data, data[1,] == 0)

ただし、dim(x)列の数は同じですdim(data)が、行の数は異なります。行1の値が0の列だけを返すようにする方法についてのアイデアはありますか?

ローランドはい。あなたは例です df は、データフレームがどのように見えるかです。データフレームには最大 30,000 のマーカーと 400 人を超える患者が含まれているため、dput(head(data)). 再形成のヒントをありがとう、私はそれを試してみます。

あなたのコード例は、行に基づいて列をサブセット化するために機能しました

data[,c(TRUE,TRUE,data[1,-(1:2)]==1)]

データでは、すべての行と指定されたクラスの列のみを含むデータフレームを取得できました。

score 12 · Accepted Answer

あなたのデータは良い方法で整理されていません。整形したほうがいいです。

入力データがない場合、これは単なる推測です。

df <- data.frame(MarkerID=c("Class","A123","A124"),
                 MarkerName=c("","X","Y"),
                 Patient.1=c(0,1,5),
                 Patent.2=c(1,2,6),
                 Patent.3=c(0,3,7),
                 Patient.4=c(1,4,8))

#  MarkerID MarkerName Patient.1 Patent.2 Patent.3 Patient.4
#1    Class                    0        1        0         1
#2     A123          X         1        2        3         4
#3     A124          Y         5        6        7         8

df[,c(TRUE,TRUE,df[1,-(1:2)]==0)]

#  MarkerID MarkerName Patient.1 Patent.3
#1    Class                    0        0
#2     A123          X         1        3
#3     A124          Y         5        7

ここでは、最初の 2 つの列と、最初の行に 0 がある列c(TRUE,TRUE,df[1,-(1:2)]==0)の論理ベクトルを作成します。TRUE次に、このベクトルに基づいて列をサブセット化します。

df[,c(TRUE,TRUE,df[1,-(1:2)]==1)]

#  MarkerID MarkerName Patent.2 Patient.4
#1    Class                   1         1
#2     A123          X        2         4
#3     A124          Y        6         8

これにより、データがより一般的な形式 (統計ソフトウェア用) に再形成されます。

library(reshape2)  
df2 <- merge(melt(df[1,],variable.name="Patient",value.name="class")[-(1:2)],
             melt(df[-1,],variable.name="Patient"),all=TRUE)

#    Patient class MarkerID MarkerName value
#1  Patent.2     1     A123          X     2
#2  Patent.2     1     A124          Y     6
#3  Patent.3     0     A123          X     3
#4  Patent.3     0     A124          Y     7
#5 Patient.1     0     A123          X     1
#6 Patient.1     0     A124          Y     5
#7 Patient.4     1     A123          X     4
#8 Patient.4     1     A124          Y     8

次に使用できますsubset：

subset(df2,class==0)

#    Patient class MarkerID MarkerName value
#3  Patent.3     0     A123          X     3
#4  Patent.3     0     A124          Y     7
#5 Patient.1     0     A123          X     1
#6 Patient.1     0     A124          Y     5

r - R - データ フレームの行の値に基づいて列のサブセットを作成する方法

1 に答える 1

Related

Reference

r - R - データフレームの行の値に基づいて列のサブセットを作成する方法