収入、若者、都市、地域を回帰変数として使用して、米国の州の公立学校の支出 (教育) をモデル化するとします。詳細情報:?Anscombe
モデル: 教育 ~ (収入+若者+都市)*地域
library(car)
library(leaps)
#Loading Data
data(Anscombe)
data(state)
stateinfo <- data.frame(region=state.region,row.names=state.abb)
datamodel <- data.frame(merge(stateinfo,Anscombe,by="row.names"),row.names=1)
head(datamodel)
region education income young urban
AK West 372 4146 439.7 484
AL South 112 2337 362.2 584
AR South 134 2322 351.9 500
AZ West 207 3027 387.5 796
CA West 273 3968 348.4 909
CO West 192 3340 358.1 785
#Saturated Model
MOD1 <- lm(education~(.-region)*region,datamodel)
summary(MOD1)
#anova(MOD1)
#Look for the "best" model
MOD1.subset <- regsubsets(education~(.-region)*region,datamodel,nvmax=15)
plot(MOD1.subset)
3 つの変数と 1 つの交互作用 (教育 ~ 所得 + 若者 + 都市 + 西部地域:若者) を持つモデルは、BIC の点で最良のようです。
coef(MOD1.subset,4)
問題は、数式を手動で記述せずに、そのモデルから ML オブジェクトを取得するにはどうすればよいかということです。
summaryHH
投稿する前に、やなどの regsubsets オブジェクトに対していくつかの興味深い機能を備えたパッケージ HH を見つけましたlm.regsubsets
。
library(HH)
summaryHH(MOD1.subset)[4,]
lm.regsubsets(MOD1.subset,4)
lm.regsubsets
私が望むことはありますが、相互作用の解析に問題があると思いますが、代替案はありますか?