0

長い列 (Excel では 9500 行) があり、そこには多くの遺伝子 ID があります。重複を削除したい。

ID
BXDC2                     
BXDC5                   
BXDC5                     
BZRPL1                    
BZRPL1                                       
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125          
C10orf125       

そして、結果を次のようにしたい:

ID
BXDC2                     
BXDC5                                      
BZRPL1                    
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125         

誰かがRスクリプトで私を助けることができます:-)?

4

1 に答える 1

4

duplicatedまたはを使用できますunique。ここでは、列名が「ID」であると仮定しています

 df1[!duplicated(df1$ID),,drop=FALSE]

または

  library(data.table)#v1.9.4+
  unique(setDT(df1), by='ID')
于 2015-07-11T11:18:58.440 に答える