パンダを使用して、他の列の値を条件として、いくつかの行と列の値を平均したいと思います。データフレームには次の情報が含まれています。
- 精度を示す列 (「acc」と省略)
- 0 = 応答なし
- 1 = 不正解
- 2 = 正しい
- 反応時間を示す列 (「rt」と省略)
以下は、データフレーム内の情報の抜粋です。
a1_acc a1_rt a2_acc a2_rt a3_acc a3_rt b_acc b_rt
2 780 2 830 2 690 2 950
1 630 2 750 0 0 2 890
2 710 2 810 1 740 1 820
私がやりたいことは、すべての「a」(「b」ではない) の反応時間を、それらが正しい応答からのものである場合に結合することです。つまり、次の反応時間を含む numpy 配列 (または他の適切なデータ構造) が必要です。
780, 830, 690, 750, 710, 810
この情報に基づいて、平均反応時間を計算したいと思います (平均から 3 標準偏差を超える反応時間を除外した後)。
どんな助けでも大歓迎です。
トーマス