流れるような大きなデータセットがあり、これを簡単に検索したい:
>mydata
ID TF
hsa-let-7a-1 SRF
hsa-let-7a-1 PPARG
hsa-let-7a-2 AREB6
hsa-let-7a-3 1-Oct
hsa-let-7a-3 SRF
hsa-let-7a-3 PPARG
hsa-let-7b SRF
. .
. .
. .
問題: 与えられた について、内で同じ TF を持つy<- c("hsa-let-7a-3","hsa-let-7a-1","hsa-let-7b"...)要素を見つけます。の一部の要素が にない可能性があるため、チェックは ! にある y の要素に対して行う必要があります。ymydatayIDID
最後に、クラスターまたはグループのようにそれらを出力します。各グループ/クラスター ID には同一TFの . 問題は、 mydata に異なる .id を持つ同一の ID があることですTF。Rでこれを実装するのを手伝ってくれる人はいますか? 約例から期待される出力は(出力のすべての ID は にありますが、すべての要素がyにあるわけではありません!) : yID
ID TF
>group1 hsa-let-7a-1 SRF
hsa-let-7a-3 SRF
hsa-let-7b SRF
>group2 hsa-let-7a-1 PPARG
hsa-let-7a-3 PPARG