0

前処理ステップとして、 100 個の異なるサンプル(列)から約 60,000 個の遺伝子を含む大量の RNA-seq データから、上位 1000 個の非常に可変性の高い遺伝子 (行) を選択する必要があります。列の値には、3 回の平均値が既に含まれています。表には FPKM で正規化された値が含まれています (注: raw カウントにアクセスできず、一般的な R パッケージを使用できません。これらのパッケージは raw カウントを入力として受け取るためです)。トップ1000の可変遺伝子?

rowSums()関数を使用して遺伝子を除外しようとし( rowsums 値が低い遺伝子を削除するため)、60k 遺伝子から 10K 遺伝子に絞り込みましたが、可変性の高い遺伝子を選択する正しい方法かどうかはわかりません。どんな入力でも大歓迎です。

4

0 に答える 0