2 つのファイル/データセットがあります: 1) 2 列と 80,000 行。最初の列には行名 (遺伝子リスト) のみが含まれ、2 番目の列はそれらの発現値 2) は遺伝子クラスター ファイルです。各遺伝子クラスターの平均発現値を計算したい。
Rを使用してどのように行うことができますか?
#dataset 1
gene1 2.4
gene2 5.2
gene3 0.1
...
gene80000 2.1
#dataset 2
cluster 1 gene1 gene2 gene80 gene34500
cluster 2 gene3 gene4
cluster 3 gene16000 gene2200
....
cluster 27992 gene5 gene10 gene135