ゲノム データを含む 2 つのデータ フレームがあり、「feature」列のエントリがデータ フレーム 2 の行の「feature」列のエントリと等しいデータ フレーム 1 のすべての行を削除する必要があります。
df1 <- data.frame(feature=c("ENSG419","ENSG1617","ENSG1629","ENSG16230"),distance=c(9833,2460,50538,51162),origin=c("e2","e2","e2","e2"))
df2 <- data.frame(feature=c("ENSG4939","ENSG1617","ENSG5844","ENSG10292"),distance=c(8441,8970,10320,139),origin=c("etoh","etoh","etoh","etoh"))
> df1
feature distance origin
1 ENSG419 9833 e2
2 ENSG1617 2460 e2
3 ENSG1629 50538 e2
4 ENSG16230 51162 e2
> df2
feature distance origin
1 ENSG4939 8441 etoh
2 ENSG1617 8970 etoh
3 ENSG5844 10320 etoh
4 ENSG10292 139 etoh
私はこれを取得したいと思います:
feature distance origin
1 ENSG419 9833 e2
2 ENSG1629 50538 e2
3 ENSG16230 51162 e2
2 つのデータ フレームを新しいデータ フレームにバインドし、その後、新しいデータ フレームの同一の機能を持つ行を抽出することで、重複するエントリを削除しようとしました。ここで、元のデータ フレーム 1 から上記の行を削除します。
df_new <- rbind(df1,df2)
df_new[duplicated(df_new[,1]),]
とにかく、より良い解決策があると確信しています。どんな提案にもとても感謝しています!