m という次のテーブルがあります。
Identifier DAT_SN_e15.5_1 DAT_SN_e15.5_2 DAT_SN_p2_1 DAT_SN_p2_2
100009600 3 1 0 0
100009609 13 4 1 6
100009614 0 0 0 0
100009664 9 17 5 7
100012 0 0 0 0
100017 0 0 0 0
100019 1275 70 54 353
100033459 0 0 0 0
100034251 0 0 0 0
100034361 277 4 114 830
列番号 1 は遺伝子識別子、列 2 と 3 は DAT_SN_e15.5 の生物学的複製、列 4 と 5 は DAT_SN_p2 の生物学的複製です。私の現実世界のデータは、それぞれ 2 つの複製を持つ 56 のそのようなサンプルで構成されています。名前に基づいて複製を認識し、名前の末尾にある 1 または 2 の違いのみを認識する方法はありますか?
もしそうなら、各識別子と各サンプルの 2 つの値を平均し、遺伝子識別子、DAT_SN_e15.5_ave および DAT_SN_p2_ave という名前の列を含む新しいテーブル m.rep<- を作成するにはどうすればよいでしょうか。