研究論文で見つけた分析 (トランスクリプトーム分析) を再現しようとしています。メソッドセクションには次のように記載されています。
正規化後、各細胞株の発現閾値を計算して、技術的なノイズと見なすことができる低強度のプローブを取り除きました。最初に、プローブセットを発現値の昇順でソートしました。各プローブ セットについて、t 検定を実行して、このプローブ セットと発現値の少ないプローブ セットの中央値との間の差次的発現を評価しました。
この分析を再現するために、R で shorth 関数を使用しました。それが適切な方法であると考えているかどうかを知りたいです。
私のデータは、Affymetrix Hugene 1.1 st アレイからのものです。RMA (dat)を使用して正規化した後、次のコードを実行して、発現の少ないプローブ セットを取得しました。
med.exp <- rowMedians(exprs(dat))
med <- shorth(med.exprs)
そして、各プローブセットをmed値t.test
と比較するための a を計算しました
tt <- rep(0.8256, 23) ## 0.8256 is the value of *shorth(med.exprs)* and I have 23 samples
result.pvalue <- sapply(1:nrow(myAB1_rma.exprs), function(i) t.test(dat[i,], tt))
このアプローチは有効でしょうか?
よろしくお願いします。
ファン