階層/マルチレベル/パネル データセットで作業する場合、使用可能な変数のグループ内およびグループ間の標準偏差を返すパッケージを採用すると非常に役立つ場合があります。
これは、次のデータを使用しStata
て、コマンドを使用して簡単に実行できるものです
xtsum, i(momid)
私は調査を行いましたが、それR
を行うことができるパッケージが見つかりません..
編集:
アイデアを修正するために、階層的なデータセットの例を次に示します。
son_id mom_id hispanic mom_smoke son_birthweigth
1 1 1 1 3950
2 1 1 0 3890
3 1 1 0 3990
1 2 0 1 4200
2 2 0 1 4120
1 3 0 0 2975
2 3 0 1 2980
「マルチレベル」構造は、各母親 (上位レベル) に 2 人以上の息子 (下位レベル) がいるという事実によって与えられます。したがって、各母親は観察のグループを定義します。
したがって、各データセット変数は、母親間および母親内で、または母親間でのみ変化する可能性があります。birtweigth
母親によって異なりますが、同じ母親の中でも異なります。代わりにhispanic
、同じ母親に固定されています。
たとえば、 の母親内分散son_birthweigth
は次のとおりです。
# mom1 means
bwt_mean1 <- (3950+3890+3990)/3
bwt_mean2 <- (4200+4120)/2
bwt_mean3 <- (2975+2980)/2
# Within-mother variance for birthweigth
((3950-bwt_mean1)^2 + (3890-bwt_mean1)^2 + (3990-bwt_mean1)^2 +
(4200-bwt_mean2)^2 + (4120-bwt_mean2)^2 +
(2975-bwt_mean3)^2 + (2980-bwt_mean3)^2)/(7-1)
母親間の分散は次のとおりです。
# overall mean of birthweigth:
# mean <- sum(data$son_birthweigth)/length(data$son_birthweigth)
mean <- (3950+3890+3990+4200+4120+2975+2980)/7
# within variance:
((bwt_mean1-mean)^2 + (bwt_mean2-mean)^2 + (bwt_mean3-mean)^2)/(3-1)