最初の列が次のような大きな data.frame があります。
"COL"
ELOVL6
ELOVL7
ELP2
EMC1 (EG:23065 を
含む) EPT1 (EG:28042 を含む)
ZEB1 (EG:29009 を含む)
すべての (EG:... を含む) を削除して、次の出力を得たいと思います。
"COL"
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1
について何か提案はありますか?
事前にどうもありがとう
最初の列が次のような大きな data.frame があります。
"COL"
ELOVL6
ELOVL7
ELP2
EMC1 (EG:23065 を
含む) EPT1 (EG:28042 を含む)
ZEB1 (EG:29009 を含む)
すべての (EG:... を含む) を削除して、次の出力を得たいと思います。
"COL"
ELOVL6
ELOVL7
ELP2
EMC1
EPT1
ZEB1
について何か提案はありますか?
事前にどうもありがとう
I suppose y your column of the data.frame
sapply(as.list(y),function(x){gsub("(.*)\\(.*\\)", "\\1", x)})
編集
さらにシンプルに
gsub("(.*)\\(.*\\)", "\\1", x)
あなたはこのようなものを意味します...
COL <- c("ELOVL7",
"ELP2",
"EMC1 (includes EG:23065)",
"EPT1 (includes EG:28042)",
"ZEB1 (includes EG:29009)")
COL <- data.frame(COL)
data.frame(COL=sapply(strsplit(as.character(COL[,1]), split=" "), '[', 1))
COL
1 ELOVL7
2 ELP2
3 EMC1
4 EPT1
5 ZEB1