2

研究論文で見つけた分析 (トランスクリプトーム分析) を再現しようとしています。メソッドセクションには次のように記載されています。

正規化後、各細胞株の発現閾値を計算して、技術的なノイズと見なすことができる低強度のプローブを取り除きました。最初に、プローブセットを発現値の昇順でソートしました。各プローブ セットについて、t 検定を実行して、このプローブ セットと発現値の少ないプローブ セットの中央値との間の差次的発現を評価しました。

この分析を再現するために、R で shorth 関数を使用しました。それが適切な方法であると考えているかどうかを知りたいです。

私のデータは、Affymetrix Hugene 1.1 st アレイからのものです。RMA (dat)を使用して正規化した後、次のコードを実行して、発現の少ないプローブ セットを取得しました。

  med.exp <- rowMedians(exprs(dat))
  med <- shorth(med.exprs)

そして、各プローブセットをmedt.testと比較するための a を計算しました

 tt <- rep(0.8256, 23) ## 0.8256 is the value of *shorth(med.exprs)* and I have 23 samples
 result.pvalue <- sapply(1:nrow(myAB1_rma.exprs), function(i) t.test(dat[i,], tt))

このアプローチは有効でしょうか?

よろしくお願いします。

ファン

4

0 に答える 0