処理済みと未処理の 2 つの条件で 200 個の遺伝子の発現値 (log2) があり、各条件で 20 個の複製があります。各遺伝子の各条件間の相関関係を計算し、それらを最高から最低までランク付けしたいと考えています。
これはどちらかというとバイオスタットの問題ですが、私たちの多くがこれに遭遇する生物学者/バイオプログラマーにとっては重要な問題だと思います.
データセットは次のようになります。
Gene UT1 UT2 T1 T2
DDR1 8.111795978 7.7606511867 7.9362235824 7.5974674936
RFC2 10.2418824097 9.7752152714 10.0085488406 9.5723427524
HSPA6 6.5850239731 6.7916563534 6.6883401632 7.3659252344
PAX8 9.2965160827 9.2031177653 9.249816924 8.667772504
GUCA1A 5.4828021059 5.3797749957 5.4312885508 5.1297319374
サンプル データのサンプルごとに 2 つのレプリケートのみを示しました。
Rまたはpythonで解決策を探しています。R の cor 関数は、私が望むものを与えてくれません。