前回、複数の回答者に対して繰り返し測定された変数(procras)の測定機会(週)ごとの平均スコアをどのように計算できるかを尋ねました。したがって、長い形式の私の (簡略化された) データセットは、たとえば次のようになります (ここでは、2 人の学生と 5 つの時点、グループ化変数なし)。
studentID week procras
1 0 1.4
1 6 1.2
1 16 1.6
1 28 NA
1 40 3.8
2 0 1.4
2 6 1.8
2 16 2.0
2 28 2.5
2 40 2.8
dplyr を使用すると、測定機会ごとに平均スコアが得られます
mean_data <- group_by(DataRlong, week)%>% summarise(procras = mean(procras, na.rm = TRUE))
次のようになります。
Source: local data frame [5 x 2]
occ procras
(dbl) (dbl)
1 0 1.993141
2 6 2.124020
3 16 2.251548
4 28 2.469658
5 40 2.617903
ggplot2 を使用すると、経時的な平均変化をプロットできるようになり、dplyr の group_data() を簡単に調整することで、サブグループごとの平均値 (たとえば、男性と女性の機会ごとの平均スコア) を取得することもできます。ここで、機会ごとの平均スコア周辺の 95% CI の長さを含む列を mean_data テーブルに追加したいと思います。
http://www.cookbook-r.com/Graphs/Plotting_means_and_error_bars_(ggplot2)/は、CI を取得してプロットする方法を説明していますが、このアプローチは、任意のサブグループに対してこれを実行したいと思うとすぐに問題になるようですよね? dplyr に CI (グループサイズなどに基づく) を mean_data に自動的に含める方法はありますか? その後、新しい値をCIとしてグラフにプロットするのはかなり簡単になるはずです。ありがとうございました。