私は R を初めて使用し、3 つのグループのデータセットから miRNA の発現を分析したいと考えています。誰でも私を助けることができますか?
この場合、他のmiRNA(affyチップ上)をトップ発現遺伝子として取得しました。ここで、ヒト miRNA のみを選択したいと考えています。私を助けてください
前もって感謝します
私は R を初めて使用し、3 つのグループのデータセットから miRNA の発現を分析したいと考えています。誰でも私を助けることができますか?
この場合、他のmiRNA(affyチップ上)をトップ発現遺伝子として取得しました。ここで、ヒト miRNA のみを選択したいと考えています。私を助けてください
前もって感謝します
これまで Affy チップを使用したことがないため、データ フレームがどのように見えるかは完全にはわかりません。あなたが私たちに話してくれたと思うことを要約してみましょう。Affy チップ上のすべての microRNA のリストとその発現データを含むデータ フレームがあります。ヒトに固有のこれらの microRNA のサブセットを選択したいと考えています。
これらのマイクロRNAが実際に人間のものであるかどうかを識別する変数がデータフレームに含まれているかどうかを述べていません. この情報が含まれている場合は、この識別子に基づいてデータをサブセット化するだけです。これを行う方法の詳細については、help(subset)
またはと入力してください。help(Extract)
データ フレームにそのような識別子が含まれていない場合は、最初にすべての既知のヒト microRNA のリストを作成する必要があります。これらは、オンラインの miRBase Web サイトから手動で取得する (そして R にインポートする) か、R パッケージを使用して Ensembl からダウンロードすることができますbiomaRt
。後者を行うには、biomaRt をロードした後、次のコマンドを入力します。
miRNA <- getBM(c("mirbase_id", "ensembl_gene_id", "start_position", "chromosome_name"), filters = c("with_mirbase"), values = list(TRUE), mart = ensembl)
上記のコードは、R が miRBase カタログ内のすべての microRNA の mirbase 識別子、遺伝子 ID、開始位置、および染色体名をダウンロードすることを要求します。(以前のコマンドで人間の Ensembl mart を指定する必要があることに注意してください。これについては示していません)。
この情報をダウンロードしたら、merge
コマンドまたはおそらくコマンドを使用which
して、Affy チップ データから適切な microRNA を引き出すことができます。
これは少し複雑に聞こえるかもしれません。まだ行っていない場合は、biomaRt
との演習に時間を費やすことをお勧めしますbioconductor
。これらのパッケージに関する情報とインストール方法は、以下のリンクから入手できます。
Bioconductor
、http://www.bioconductor.org/install/biomaRt
、 http://www.stat.berkeley.edu/~sandrine/Teaching/PH292.S10/Durinck.pdfこの質問をBiostarに移行するよう依頼することを検討してください。そこではより良い反応が得られると思います。また、質問を編集して、データに関する詳細情報を提供することも検討してください。幸運を。
2012-02-26 22:08:02 のコメントを参照して、次のことを試してください。
## Load biomaRt package
library(biomaRt)
## Specify which "mart" (i.e., source of genetic data) that you want to use
ensembl <- useMart("ensembl")
ensembl <- useDataset("hsapiens_gene_ensembl", mart = ensembl)
## You can then ask the system what attributes are available for download
listAttributes(ensembl)
name description
58 mirbase_accession miRBase Accession(s)
59 mirbase_id miRBase ID(s)
60 mirbase_gene_name miRBase gene name
61 mirbase_transcript_name miRBase transcript
上に、関連する miRBase オプションを示すコマンドからの出力の一部を貼り付けました。listAttributes()
これで、次のコードを試すことができます。
## Download microRNA data
miRNA <- getBM(c("mirbase_id", "ensembl_gene_id", "start_position", "chromosome_name"), filters = c("with_mirbase"), values = list(TRUE), mart = ensembl)
## Check how much we downloaded
> dim(miRNA)
[1] 715 4
## Peak at the head of our data
> head(miRNA)
mirbase_id ensembl_gene_id start_position chromosome_name
1 hsa-mir-320c-1 ENSG00000221493 19263471 18
2 hsa-mir-133a-1 ENSG00000207786 19405659 18
3 hsa-mir-1-2 ENSG00000207694 19408965 18
4 hsa-mir-320c-2 ENSG00000212051 21901650 18
5 hsa-mir-187 ENSG00000207797 33484781 18
6 hsa-mir-1539 ENSG00000222690 47013743 18
## Check which chromosomes are contributing to our data
> table(miRNA$chromosome_name)
1 10 11 12 13 14 15 16 17 18 19 2 20 21 22 3 4 5 6 7 8 9 X
50 27 26 25 15 59 26 15 35 7 85 23 32 5 16 31 23 30 17 33 27 28 80
ここでの課題は、このダウンロードしたデータを使用して元の Affy データ フレームを解析することです。merge
ここでも、 、Extract
、および関数のヘルプ ファイルを読んで、which
最初に自分で試してみてください。