文字列に接続する 2 つの列を持つデータ フレームがあります。1 つの列 ( という名前probes
) にケースが重複しています (つまり、同じ文字列を持つ複数のケース)。プローブのケースごとに、同じ文字列を含むすべてのケースを検索し、2 番目の列 ( という名前genes
) の対応するすべてのケースの値を 1 つのケースにマージしたいと考えています。たとえば、次の構造があるとします。
probes genes
1 cg00050873 TSPY4
2 cg00061679 DAZ1
3 cg00061679 DAZ4
4 cg00061679 DAZ4
この構造に変更したい:
probes genes
1 cg00050873 TSPY4
2 cg00061679 DAZ1 DAZ4 DAZ4
明らかに、 which を使用して単一のプローブに対してこれを実行しても問題はありません。次に、貼り付けて折りたたむ
ind<-which(olap$probes=="cg00061679")
genename<-(olap[ind,2])
genecomb<-paste(genename[1:length(genename)], collapse=" ")
しかし、データフレーム全体でプローブ列の重複のインデックスを抽出する方法がわかりません。何か案は?
前もって感謝します