r - R を使用してデータを解析しながら、affy chip からヒト miRNA を選択するにはどうすればよいですか?

Question

私は R を初めて使用し、3 つのグループのデータセットから miRNA の発現を分析したいと考えています。誰でも私を助けることができますか？

この場合、他のmiRNA（affyチップ上）をトップ発現遺伝子として取得しました。ここで、ヒト miRNA のみを選択したいと考えています。私を助けてください

前もって感謝します

score 4 · Accepted Answer

概要

これまで Affy チップを使用したことがないため、データフレームがどのように見えるかは完全にはわかりません。あなたが私たちに話してくれたと思うことを要約してみましょう。Affy チップ上のすべての microRNA のリストとその発現データを含むデータフレームがあります。ヒトに固有のこれらの microRNA のサブセットを選択したいと考えています。

考えられる解決策 1

これらのマイクロRNAが実際に人間のものであるかどうかを識別する変数がデータフレームに含まれているかどうかを述べていません. この情報が含まれている場合は、この識別子に基づいてデータをサブセット化するだけです。これを行う方法の詳細については、help(subset)またはと入力してください。help(Extract)

考えられる解決策 2

データフレームにそのような識別子が含まれていない場合は、最初にすべての既知のヒト microRNA のリストを作成する必要があります。これらは、オンラインの miRBase Web サイトから手動で取得する (そして R にインポートする) か、R パッケージを使用して Ensembl からダウンロードすることができますbiomaRt。後者を行うには、biomaRt をロードした後、次のコマンドを入力します。

miRNA <- getBM(c("mirbase_id", "ensembl_gene_id", "start_position", "chromosome_name"), filters = c("with_mirbase"), values = list(TRUE), mart = ensembl)

上記のコードは、R が miRBase カタログ内のすべての microRNA の mirbase 識別子、遺伝子 ID、開始位置、および染色体名をダウンロードすることを要求します。(以前のコマンドで人間の Ensembl mart を指定する必要があることに注意してください。これについては示していません)。

この情報をダウンロードしたら、mergeコマンドまたはおそらくコマンドを使用whichして、Affy チップデータから適切な microRNA を引き出すことができます。

推奨事項

これは少し複雑に聞こえるかもしれません。まだ行っていない場合は、biomaRtとの演習に時間を費やすことをお勧めしますbioconductor。これらのパッケージに関する情報とインストール方法は、以下のリンクから入手できます。

Bioconductor、http://www.bioconductor.org/install/
を使用したデータベースマイニングbiomaRt、 http://www.stat.berkeley.edu/~sandrine/Teaching/PH292.S10/Durinck.pdf

この質問をBiostarに移行するよう依頼することを検討してください。そこではより良い反応が得られると思います。また、質問を編集して、データに関する詳細情報を提供することも検討してください。幸運を。

元の回答に編集

2012-02-26 22:08:02 のコメントを参照して、次のことを試してください。

## Load biomaRt package
library(biomaRt)

## Specify which "mart" (i.e., source of genetic data) that you want to use
ensembl <- useMart("ensembl")
ensembl <- useDataset("hsapiens_gene_ensembl", mart = ensembl)

## You can then ask the system what attributes are available for download
listAttributes(ensembl)

      name                      description
58    mirbase_accession         miRBase Accession(s)
59    mirbase_id                miRBase ID(s)
60    mirbase_gene_name         miRBase gene name
61    mirbase_transcript_name   miRBase transcript

上に、関連する miRBase オプションを示すコマンドからの出力の一部を貼り付けました。listAttributes()これで、次のコードを試すことができます。

## Download microRNA data
miRNA <- getBM(c("mirbase_id", "ensembl_gene_id", "start_position", "chromosome_name"), filters = c("with_mirbase"), values = list(TRUE), mart = ensembl)

## Check how much we downloaded
> dim(miRNA)
[1] 715   4

## Peak at the head of our data
> head(miRNA)
      mirbase_id ensembl_gene_id start_position chromosome_name
1 hsa-mir-320c-1 ENSG00000221493       19263471              18
2 hsa-mir-133a-1 ENSG00000207786       19405659              18
3    hsa-mir-1-2 ENSG00000207694       19408965              18
4 hsa-mir-320c-2 ENSG00000212051       21901650              18
5    hsa-mir-187 ENSG00000207797       33484781              18
6   hsa-mir-1539 ENSG00000222690       47013743              18

## Check which chromosomes are contributing to our data
> table(miRNA$chromosome_name)

 1 10 11 12 13 14 15 16 17 18 19  2 20 21 22  3  4  5  6  7  8  9  X 
50 27 26 25 15 59 26 15 35  7 85 23 32  5 16 31 23 30 17 33 27 28 80

ここでの課題は、このダウンロードしたデータを使用して元の Affy データフレームを解析することです。mergeここでも、、Extract、および関数のヘルプファイルを読んで、which最初に自分で試してみてください。

r - R を使用してデータを解析しながら、affy chip からヒト miRNA を選択するにはどうすればよいですか?

1 に答える 1

概要

考えられる解決策 1

考えられる解決策 2

推奨事項

元の回答に編集

Related

Reference