1

3 つの列で構成されるデータ フレームから始めます。列 #1 には、何人かの体重 (列 #2) の体重 (列 #3) が kg 単位で測定された 3 つの異なる期間を示す ID が含まれています。

すべての人が不規則に測定されています。つまり、すべての期間にわたってではなく、期間内に複数回または 1 回だけ測定されている人もいます。

   id       person_name person_weight
    1          Carol         51
    1          Mike          76
    1          Mike          81
    1          Dave          66
    1          Carol         59
    2          James         78
    2          Simone        55
    2          Simone        49
    2          David         85
    3          Mike          93
    3          Dave          110
    3          Dave          98 

実際、ここに挙げたものはすべて単純化された例にすぎません。この種のデータ収集が意味をなさない場合でも気にしないでください。

ここで、一定期間内の各人の平均 (平均) 体重を計算し、最終的に次のようなデータ フレームを結合したいと考えています。

group_id    Carol   Mike    Dave    James   Simone  David
   1         55     78.5     66      NA       NA     NA
   2         NA      NA      NA      78       52     85
   3         NA      93      104     NA       NA     NA

基本的な R 関数 (テーブル、適用など) をいくつか試しましたが、列間の依存関係を処理できませんでした。

2番目/「結合された」データフレームに近づくための助けを事前にありがとう。

4

1 に答える 1

5

シンプルなようdcastです:

library(reshape2)
dcast(dat,id ~person_name,
      fun.aggregate = mean,
      value.var = "person_weight",fill = NA_real_)
  id Carol Dave David James Mike Simone
1  1    55   66    NA    NA 78.5     NA
2  2    NA   NA    85    78   NA     52
3  3    NA  104    NA    NA 93.0     NA
于 2013-06-04T17:44:20.687 に答える