4

ランダム効果と滑らかな曲線推定の間には二重性があることを認識しています。このリンクで、Simon Wood が mgcv を使用してランダム効果を指定する方法を説明しています。特筆すべきは、次の一節です。

たとえば、g が因子の場合、s(g,bs="re") は、g の各レベルに対してランダム係数を生成します。乱数係数はすべて iid 法線としてモデル化されます。

簡単なシミュレーションの後、これが正しく、モデルの適合がほぼ同じであることがわかります。ただし、可能性と自由度は非常に異なります。誰でも違いを説明できますか?テストにはどれを使用する必要がありますか?

library(mgcv)
library(lme4)
set.seed(1)
x <- rnorm(1000) 
ID <- rep(1:200,each=5)
y <- x 
for(i in 1:200) y[which(ID==i)] <- y[which(ID==i)] + rnorm(1)
y <- y + rnorm(1000)
ID <- as.factor(ID)

# gam (mgcv)
m <- gam(y ~ x + s(ID,bs="re"))
gam.vcomp(m)
coef(m)[1:2]
logLik(m)

# lmer
m2 <- lmer(y ~ x + (1|ID))
sqrt(VarCorr(m2)$ID[1])
summary(m2)$coef[,1]
logLik(m2)

mean( abs( fitted(m)-fitted(m2) ) )

完全な開示: この問題が発生したのは、ランダム効果 (反復測定) も含む GAM を当てはめたいが、それらのモデルで尤度ベースのテストを信頼できるかどうかを知る必要があるためです。

4

0 に答える 0