私はRとこのリストに不慣れです。次の質問があまりにも基本的または情報不足でないことを願っています。過去数時間、アーカイブをチェックインしていましたが役に立たなかったので、ここに投稿します。問題の一部は、必要な機能を参照するときに使用する適切な用語を正確に知らないことです。これにより、検索が困難になる可能性があります。そうは言っても、ここに私が解決する必要があるものがあります:
次のようなデータフレームがあります。
Subject Item Region RT
13 102 1 R1 1245
14 102 4 R1 1677
15 102 7 R1 1730
25 103 1 R1 815
26 103 4 R1 828
27 103 7 R1 985
1489 102 1 R2 356
1490 102 4 R2 510
1491 102 7 R2 544
1501 103 1 R2 447
1502 103 4 R2 486
1503 103 7 R2 221
...
各被験者には、1 つの項目の複数の領域に対する RT (反応時間) があります。そして、各被験者は複数のアイテムを見ます。
外れ値を計算してから正規化したいと考えています (ただし、このスレッドではその解決策について心配するつもりはありません)。最初のステップとして、いくつかの単純な関数を使用して、各被験者の各地域の平均と SD を計算し、項目全体をまとめました (つまり、(被験者がその地域で持っているすべての RT の平均):
Mean = with(test, aggregate(RT, by = list(Subject,Region),mean, na.rm=TRUE))
SD = with(test, aggregate(RT, by = list(Subject,Region),sd, na.rm=TRUE))
次に、cbind を使用して名前を変更し、すべてのデータを 1 つのデータフレームにまとめました。
Subject Region Mean SD
1 102 R1 1143.7778 202.25530
2 102 R2 431.8611 125.84393
9 103 R1 923.0833 179.51098
10 103 R2 344.1667 146.51192
...
問題は、すべての手段を各被験者の正しい領域に関連付ける必要があることです。つまり、次のような出力を生成したいと思います (すべてのサブジェクト 102 領域 R1 の平均値と SD は同じですが、RT が異なることに注意してください)。
Subject Item Region RT Mean SD
13 102 1 R1 1245 1143.7778 202.25530
14 102 4 R1 1677 1143.7778 202.25530
15 102 7 R1 1730 1143.7778 202.25530
25 103 1 R1 815 923.0833 179.51098
26 103 4 R1 828 923.0833 179.51098
27 103 7 R1 985 923.0833 179.51098
1489 102 1 R2 356 431.8611 125.84393
1490 102 4 R2 510 431.8611 125.84393
1491 102 7 R2 544 431.8611 125.84393
1501 103 1 R2 447 344.1667 146.51192
1502 103 4 R2 486 344.1667 146.51192
1503 103 7 R2 221 344.1667 146.51192
merge と cbind は、ある値を別の値に拡張して一致させるという仕事をしないようです。おそらく、メルトやキーを使用する機能を利用する必要がありますか?
私が自分でこれを試すことができるように、誰かが私に関連する機能を教えてくれることを願っています.
読んでくれてありがとう...