次のようなデータフレームがあります。
region group mid_pop
1 2 1146
2 4 1682
3 3 2891
4 1 7654
5 1 3289
6 2 1128
7 3 2121
8 4 3217
9 3 1616
10 1 1717
多項回帰を実行し、次のように各グループに属する確率を得ました。
mlogit <- multinom(group ~ mid_pop)
probs <- predict(mlogit, type="probs")
probs1 probs2 probs3 probs4
0.2 0.3 0.4 0.1
0.3 0.4 0.15 0.15
0.4 0.1 0.3 0.2
0.7 0.1 0.1 0.1
0.2 0.3 0.4 0.1
0.6 0.1 0.1 0.2
0.7 0.1 0.1 0.1
0.3 0.2 0.1 0.4
0.2 0.1 0.1 0.6
0.1 0.2 0.1 0.6
次に、各地域の重みを作成しました。重みは、「グループ 1 に属する確率を、その地域が属している現在のグループに属する確率で割った値」です。次に、重みに mid_pop を掛けます。
region group mid_pop weight mid_pop(weighted)
1 2 1146 0.66 756.36
2 4 1682 2 3364
3 3 2891 2 5782
4 1 7654 0.7 5357.8
5 1 3289 0.2 657.8
6 2 1128 0.3 338.4
7 3 2121 0.7 1484.7
8 4 3217 0.75 2412.75
9 3 1616 0.33 533.28
10 1 1717 0.16 274.72
ここで、グループの標準化された平均差を実行し、加重前後の mid_pop の平均の差を確認したいと思います。結果は次のようになります。
SDM (group 1 vs. group 2)=....
SDM (group 1 vs. group 3)=....
SDM (group 1 vs. group 4)= ....
誰でも私たちがそれを行うのを手伝ってくれますか? 前もって感謝します。