-1

I have a data.frame (9 columns and 5 rows) that looks like:

 List    Count 
  R472    1   RAP1GDS1    AKT1    ERC1    ZRSR2   SMAD4   ASXL1   NA
  R47     1   TCF12       DICER1  OLIG2   GATA3   CLP1    SMAD4   NA
  R844    2   RNF213      LHFP    MLLT6   TTL    SMARCA4   AKT2   TSC2
  R845    2   MLL         MYH9    FBXW7   VTI1A   CLP1     NF2    PIK3CA
  R975    2   TCF12       ELK4    PDE4DIP FANCG   ZRSR2   FAM123B FCRL4

列「カウント」に従ってデータをグループに分割し、対応する要素を比較して違いを見つけ(そしてそれらに注釈を付け)、類似点を見つけたいと思います。例: 望ましい出力:

 Count1      Common   How_many_similar   Differences   How_many_different
             SMAD4           1            RAP1GDS1             10  
                                            AKT1
                                            ERC1
                                            ....

誰でも私を助けることができますか?

ありがとう。

4

1 に答える 1

0

入力データがどのように構造化されているかについての詳細が不足しているため (dputそこにあると便利です!)、正確な情報を提供することは困難です。結局のところ、データ フレームでは要素をリストにすることも、行に異なる数の列を持たせることもできません。そのため、入力をカウントごとにチャンクに分割する方法を伝えるのは困難です。

比較のために、比較用のすべてのデータを因子に変換し、tableその因子を使用して、特定のベクトルで各要素が発生する回数を計算することをお勧めします。つまり、行を単純に連結する必要があり、単一のグループの行を単一のベクトルとして提供するデータ構造は、これに非常に適しています。

于 2012-10-17T15:48:27.717 に答える