私はRとプログラミング自体にかなり慣れていませんが、現在、data.frameに問題があり、作業を続けることができません。
次のような一連のデータがあります
表1
Individual Score
Tim 45
Tim 77
Tim 32
Clare 92
Clare 70
Clare 88
上記の表 1 について説明します。私には複数の個人 (上の例では TIm と Clare) がいて、彼らが 3 つの異なる機会 (2009、2010、2011) で提示したテストのスコアを持っています。上記を次のように変換します。
表2
Individual Score09 Score10 Score11
Tim 45 77 32
Clare 92 70 88
もともとテストのサブセットの情報を持っていたので、ddply を使用して表 1 を取得しました (変数スコアはすべてのサブセットの合計にすぎません)。
実際に表 1 の代わりに表 2 を使用する方法があれば教えてください。10000 件以上の観測があり、表 1 の設定では意図した提案を進められないためです。
編集:
表 1 が生成された元の df は次のとおりです。
データフレームは次のとおりです
Base Individual score_math score_bio score_chem
SB1120091 Tim 12 23 10
SB1120092 Tim 30 25 22
SB1120101 Tim 17 5 10
SB1120091 Clare 50 20 22
SB1120092 Clare 40 10 20
SB1120101 Clare 47 20 21
コードは次のとおりです。
>Table1 <-ddply(x, .(Indivual), summarise, Score=(score_math*score_bio*score_chem))
EDIT2:
元のデータ セットには Year 変数はありませんが、テストがいつ行われたかに関する情報を提供するベース変数があります。
また、スコア変数は、すべてのサブセット スコアの積として計算されます。