0

Eset の行名として遺伝子のリストがあり、それらを Ensembl 遺伝子 ID に変換したいと考えています。bioMart パッケージで getGene を使用しましたが、一部の遺伝子で同じ名前が 2 回使用されました! ここに私のコードの小さな例があります:

library (biomaRt)
rownames(eset)
[1] "EPC1"   "MYO3A"  "PARD3"  "ATRNL1" "GDF2"   "IL10RA" "GAD2"   "CCDC6"

getGene(rownames(eset),type='hgnc_symbol',mart)[c(1,9)]

# [1] is the hgnc_symbol to recheck the matched data
# [9] is the ensemble_gene_id

   hgnc_symbol ensembl_gene_id
    1      ATRNL1 ENSG00000107518
    2       CCDC6 ENSG00000108091
    3        EPC1 ENSG00000120616
    4        GAD2 ENSG00000136750
    5        GDF2 ENSG00000263761
    6      IL10RA ENSG00000110324
    7      IL10RA         LRG_151
    8       MYO3A ENSG00000095777
    9       PARD3 ENSG00000148498

ご覧のとおり、hgnc_symbol 列に「IL10RA」のエントリが 2 つあります。しかし、行名(eset)には「IL10RA」が1つしかありませんでした。Ensembl_ID を fData(eset) に追加しようとしたときに、これが最後に問題を引き起こします。どうすればこの問題を解決できますか? 次のような結果が得られます。

 hgnc_symbol ensembl_gene_id
    1      ATRNL1 ENSG00000107518
    2       CCDC6 ENSG00000108091
    3        EPC1 ENSG00000120616
    4        GAD2 ENSG00000136750
    5        GDF2 ENSG00000263761
    6      IL10RA ENSG00000110324
    7       MYO3A ENSG00000095777
    8       PARD3 ENSG00000148498

前もって感謝します、

4

1 に答える 1