1

遺伝子発現データを含む affyBatch オブジェクトがあります。データはオプションなしで dat <- ReadAffy() を使用して読み込まれます。次に、使用したい 5600 個の遺伝子を抽出します。dat <- RemoveProbes(listOutProbeSets, cdfpackagename, probepackagename)

次に、dat.rma <- rma(dat) を使用して発現データを正規化します。

ここで、生データと rma 正規化データを .csv ファイルにエクスポートしたいと考えています。データを調べると、exprs(dat) のサイズが 226576 x 30 で、dat.rma のサイズが 5600 x 30 であることがわかりました。RAW 式の値の 5600 x 30 のマトリックスを抽出するにはどうすればよいですか? 生データの 226576 行がどこから来たのかわかりません!

私は生体伝導体データ構造の初心者です! 実行可能なサンプル コードを提供できなくて申し訳ありません。この場合、どうすればよいかわかりません。

4

1 に答える 1

0

生データから rma 正規化データへの変換中に、とりわけ、低レベルのプローブ強度値をプローブ セット値 (遺伝子にマップする) に結合/要約しました。これは、(関数によって作成された) インスタンスAffyBatchよりも生のオブジェクトに多くの機能がある理由を説明しています。また、お持ちのチップによっては、プローブセットごとにいくつかの完全一致 (PM) プローブとミスマッチ (MM) プローブがあり、プローブセットごとのプローブ数が増加します。マッピング プローブ -> プローブセットは、チップ定義ファイルで定義され、自動的に処理されます。ExpressionSetrma

ただし、いくつかの追加の考えがあります。正規化を行う前にプローブを削除することは、良いことではないかもしれません。正規化を実行するときの 1 つの仮定は、ほとんどの「遺伝子」は変更されないということです。そのため、「関心のあるもの」のみを保持すると、もちろん「関心のあるもの」が何を意味するかに応じて、これが壊れる可能性があります。ExpressionSet正規化後、 でいつでもフィルタリングを行うことができます。

> library(affydata)
> data(Dilution) ## gets some test data
> eset <- rma(Dilution) ## rma normalisation
> featureNames(eset)[1:10] ## gets some probesets of interest
> ps
 [1] "100_g_at"  "1000_at"   "1001_at"   "1002_f_at" "1003_s_at" "1004_at"  
 [7] "1005_at"   "1006_at"   "1007_s_at" "1008_f_at"
> dim(eset) ## full dataset
Features  Samples 
   12625        4 
> dim(eset[ps,]) ## only 10 first probesets of interest
Features  Samples 
      10        4 

お役に立てれば。

于 2011-06-20T13:21:03.120 に答える