SPSS は、カスタム テーブルの z 検定に関しては、複数回答セットをカテゴリ変数とは異なる方法で扱います。この動作は、応答の重複に関連していると思いますが、その方法がわかりません。
では、多重応答セット (MRset) に関して、SPSS はどのように z 検定を行うのでしょうか?
私の目標は、R で MRsets の SPSS z-test を再現することですが、SPSS が実際に何をするのかわかりません。通常、SPSS カスタム テーブルの z-testing は、
prop.test(c(proportion1,proportion2),c(columnSum1,columSum2),"two.sided",correct=F)
しかし、明らかに MRsets の場合は異なります。
これを明確にするために、このカテゴリ対 MRset の比較を見てください。
カテゴリ変量 z 検定 (C 列と D 列は z 検定によると違いはありません)
- カテゴリー データセット (重複なし、3623 件):データセットのダウンロード
- カテゴリ重複行列 (重複なし):
カテゴリカル z 検定 SPSS 構文
CTABLES /VLABELS VARIABLES=splitVar catVar DISPLAY=DEFAULT /TABLE splitVar [C][COUNT F40.0] BY catVar [C] /CATEGORIES VARIABLES=splitVar catVar ORDER=A KEY=VALUE EMPTY=EXCLUDE /COMPARETEST TYPE=PROP ALPHA=0.05 ADJUST=NONE ORIGIN=COLUMN INCLUDEMRSETS=NO CATEGORIES=ALLVISIBLE.
C<->D z-test の R 再現 (最初の行): http://www.r-fiddle.org/#/fiddle?id=p4gw9ftk
"Categorical var z-test" "Doing a proportions test for first row (splitVar=1) and columns C and D" prop.test(c(198,242), c(198+35,242+65), alternative="two.sided", correct=F ) "As we see, there are no significant differences in the proportions on an alpha=0.05 level"
MRset z-test (表の数値は同じですが、z-test の結果は異なります: C 列と D 列に有意差があります)
- MRset データセット (重複を含む、2404 件):データセットのダウンロード
- MRset オーバーラップ マトリックス:
- MRset z テスト出力:
MRset z-test SPSS 構文:
CTABLES /VLABELS VARIABLES=splitVar $MySet DISPLAY=DEFAULT /TABLE splitVar [C] BY $MySet [C][COUNT F40.0] /CATEGORIES VARIABLES=splitVar ORDER=A KEY=VALUE EMPTY=EXCLUDE /CATEGORIES VARIABLES=$MySet EMPTY=INCLUDE /COMPARETEST TYPE=PROP ALPHA=0.05 ADJUST=NONE ORIGIN=COLUMN INCLUDEMRSETS=YES CATEGORIES=ALLVISIBLE.
C<->D z-test の R 再現 (最初の行): http://www.r-fiddle.org/#/fiddle?id=GAhnnrv0
"MRset z-test" "Doing a proportions test for first row (splitVar=1) and columns C and D" overlap_splitvar1_CD <- 53 overlap_splitvar2_CD <- 9 prop.test(c(198-overlap_splitvar1_CD,242-overlap_splitvar1_CD), c(198+35-overlap_splitvar1_CD-overlap_splitvar2_CD,242+65-overlap_splitvar1_CD-overlap_splitvar2_CD), alternative="two.sided", correct=F ) "As we see, there are still no significant differences in the proportions on an alpha=0.05 level. In contrast, SPSS does detect a difference. Why?"
MRset R コードからわかるように、オーバーラップ ケースを差し引いても役に立ちません。多分それは重み付けか何かにリンクされていますか?アイデアをどうもありがとう。
おそらく役立つリンク:重みと多重応答セットに関する注意事項