r - 特定のパターンを見つけて置換する

Question

最初の列が次のような大きな data.frame があります。

"COL"
ELOVL6
ELOVL7
ELP2
EMC1 (EG:23065 を
含む) EPT1 (EG:28042 を含む)
ZEB1 (EG:29009 を含む)

すべての (EG:... を含む) を削除して、次の出力を得たいと思います。

"COL"
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1

について何か提案はありますか？

事前にどうもありがとう

score 8 · Accepted Answer

 I suppose y your column of the data.frame

 sapply(as.list(y),function(x){gsub("(.*)\\(.*\\)", "\\1", x)})

編集

さらにシンプルに

 gsub("(.*)\\(.*\\)", "\\1", x)

score 2 · Accepted Answer

あなたはこのようなものを意味します...

COL <- c("ELOVL7",
         "ELP2",
         "EMC1 (includes EG:23065)",
         "EPT1 (includes EG:28042)",
         "ZEB1 (includes EG:29009)")

COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
     COL
1 ELOVL7
2   ELP2
3   EMC1
4   EPT1
5   ZEB1

r - 特定のパターンを見つけて置換する

2 に答える 2

Related

Reference