ここに詳細を示します。自己責任で使用してください。私はglm
専門家ではありませんが、ここrにはいくつかあります。問題があれば指摘してくれるかもしれません。
# reproducible data
set.seed(2)
car <- as.factor(sample(c("TRUE","FALSE"), 1000, replace=TRUE))
watch <- as.factor(sample(c("TRUE","FALSE"), 1000, replace=TRUE))
# inspect data
(mytable <- table(car,watch))
watch
car FALSE TRUE
FALSE 247 250
TRUE 254 249
summary(mytable)
Number of cases in table: 1000
Number of factors: 2
Test for independence of all factors:
Chisq = 0.06381, df = 1, p-value = 0.8006
# variables are probably not independent
# reshape for glm
(mydf <- as.data.frame(mytable))
car watch Freq
1 FALSE FALSE 247
2 TRUE FALSE 254
3 FALSE TRUE 250
4 TRUE TRUE 249
Aditya Sihag によって提案されたモデル:
summary(glmlp <- glm(watch ~ car, data = mydf, family=binomial(link=logit)))
Call:
glm(formula = watch ~ car, family = binomial(link = logit), data = mydf)
Deviance Residuals:
1 2 3 4
-1.177 -1.177 1.177 1.177
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.110e-16 1.414e+00 0 1
carTRUE -2.220e-16 2.000e+00 0 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 5.5452 on 3 degrees of freedom
Residual deviance: 5.5452 on 2 degrees of freedom
AIC: 9.5452
Number of Fisher Scoring iterations: 2
詳細については、次のページを参照してくださいglm
。
http://www.ats.ucla.edu/stat/r/dae/probit.htm
http://data.princeton.edu/R/glms.html
https://stat.ethz.ch/pipermail/r-help/2007-March/126891.html