私は R でバイナリ ロジスティック回帰を行っており、独立変数の一部は順序データを表しています。私はそれが正しく行われていることを確認したいだけです。以下の例では、サンプル データを作成し、独立変数 "I" が連続データを表すという仮定に基づいて glm() を実行しました。次に、代わりに、ordered(I) を使用して再度実行しました。結果は少し違ったものになったので、テストは成功したようです。私の質問は、私が思っていることを行っているかどうかです...たとえば、整数データを見て、整数の値に基づいて序数データに強制し、アイデアを説明するために別の式で glm() を実行しています「1」、「2」、「3」などの間の距離は同じではない可能性があるため、これが序数データを表している場合は「正しい」ことになります。
> str(gorilla)
'data.frame': 14 obs. of 2 variables:
$ I: int 1 1 1 2 2 2 3 3 4 4 ...
$ D: int 0 0 1 0 0 1 1 1 0 1 ...
> glm.out = glm(D ~ I, family=binomial(logit), data=gorilla)
> summary(glm.out)
...次の順序で再試行しました:
glm.out = glm(D ~ 順序付けられた(I)、家族=二項(ロジット)、データ=ゴリラ)
> summary(glm.out)
PS: 役立つ場合は、これらのテストからの完全な出力を次に示します (私が気付いていることの 1 つは、非常に大きな標準エラー番号です)。
Call:
glm(formula = D ~ I, family = binomial(logit), data = gorilla)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.7067 -1.0651 0.7285 1.0137 1.4458
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.0624 1.2598 -0.843 0.399
I 0.4507 0.3846 1.172 0.241
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 19.121 on 13 degrees of freedom
Residual deviance: 17.621 on 12 degrees of freedom
AIC: 21.621
Number of Fisher Scoring iterations: 4
> glm.out = glm(D ~ ordered(I), family=binomial(logit), data=gorilla)
> summary(glm.out)
Call:
glm(formula = D ~ ordered(I), family = binomial(logit), data = gorilla)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.66511 -0.90052 0.00013 0.75853 1.48230
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 3.6557 922.4405 0.004 0.997
ordered(I).L 1.3524 1.2179 1.110 0.267
ordered(I).Q -9.5220 2465.3259 -0.004 0.997
ordered(I).C 0.1282 1.2974 0.099 0.921
ordered(I)^4 13.6943 3307.5816 0.004 0.997
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 19.121 on 13 degrees of freedom
Residual deviance: 14.909 on 9 degrees of freedom
AIC: 24.909
Number of Fisher Scoring iterations: 17
使用したデータ:
I,D
1,0
1,0
1,1
2,0
2,0
2,1
3,1
3,1
4,0
4,1
5,0
5,1
5,1
5,1