流れるような大きなデータセットがあり、これを簡単に検索したい:
>mydata
ID TF
hsa-let-7a-1 SRF
hsa-let-7a-1 PPARG
hsa-let-7a-2 AREB6
hsa-let-7a-3 1-Oct
hsa-let-7a-3 SRF
hsa-let-7a-3 PPARG
hsa-let-7b SRF
. .
. .
. .
問題: 与えられた について、内で同じ TF を持つy<- c("hsa-let-7a-3","hsa-let-7a-1","hsa-let-7b"...)
要素を見つけます。の一部の要素が にない可能性があるため、チェックは ! にある y の要素に対して行う必要があります。y
mydata
y
ID
ID
最後に、クラスターまたはグループのようにそれらを出力します。各グループ/クラスター ID には同一TF
の . 問題は、 mydata に異なる .id を持つ同一の ID があることですTF
。Rでこれを実装するのを手伝ってくれる人はいますか? 約例から期待される出力は(出力のすべての ID は にありますが、すべての要素がy
にあるわけではありません!) : y
ID
ID TF
>group1 hsa-let-7a-1 SRF
hsa-let-7a-3 SRF
hsa-let-7b SRF
>group2 hsa-let-7a-1 PPARG
hsa-let-7a-3 PPARG