空間分析を実装するために、マニュアルがここにあるRのmgcvパッケージの例で、単純なマルコフランダムフィールドスムーザーを試しました:
https://stat.ethz.ch/R-manual/R-devel/library/mgcv/html/smooth.construct.mrf.smooth.spec.html
これは私が試した例です:
library(mgcv)
data(columb) ## data frame
data(columb.polys) ## district shapes list
xt <- list(polys=columb.polys) ## neighbourhood structure info for MRF
b <- gam(crime ~ s(district,bs="mrf",xt=xt),data=columb,method="REML")
しかし、b$coefficients で推定された係数を見てみると、マルコフ確率場スムーザーから 48 の推定値があります。
> b$coefficients
(Intercept) s(district).1 s(district).2 s(district).3 s(district).4
35.12882390 -10.96490165 20.99250496 16.04968951 10.49535483
s(district).5 s(district).6 s(district).7 s(district).8 s(district).9
16.56626217 14.55352540 17.90043996 -0.60239588 13.41215603
s(district).10 s(district).11 s(district).12 s(district).13 s(district).14
18.61920671 -11.13853418 -2.95677338 7.89719220 3.04717540
s(district).15 s(district).16 s(district).17 s(district).18 s(district).19
-11.18235328 12.57473374 19.83013619 10.56130003 12.36240748
s(district).20 s(district).21 s(district).22 s(district).23 s(district).24
15.65160761 20.40965885 24.79853590 0.05312873 -14.65881026
s(district).25 s(district).26 s(district).27 s(district).28 s(district).29
-13.01294201 7.16191556 -9.36311304 3.65410713 -16.37092777
s(district).30 s(district).31 s(district).32 s(district).33 s(district).34
11.23500771 13.92036006 -14.67653893 -12.39341674 11.02216471
s(district).35 s(district).36 s(district).37 s(district).38 s(district).39
-12.93210046 -15.48924425 3.42745125 -2.54916472 -1.90604972
s(district).40 s(district).41 s(district).42 s(district).43 s(district).44
-16.25160966 -7.46491914 -4.48126353 -7.61064264 -2.91807488
s(district).45 s(district).46 s(district).47 s(district).48
-12.12765102 6.68446503 2.55883220 -0.20920888
ただし、地区形状リストには 49 のエリア (0 ~ 48) が表示されます。データを試したところ、同じ状況が発生しました。これは、28 の領域を持つデータが、マルコフ確率場平滑化から 27 の推定値しか得られなかったためです。
私の理解では、空間関数として使用されるマルコフ確率場は、構造化されたランダム効果と見なすことができます。ただし、R の mgcv パッケージのマルコフ確率場スムーザーは、最初の領域を参照レベルとして自動的に設定するようです。空間的自己相関を考慮した固定効果のようなものなのだろうか?
もしそうなら、拡張された問題は、そのような出力をどのように説明するかです? 空間推定が各エリアと参照エリアの違いのように説明できるのは非常に奇妙に感じますが、この解釈はあまり意味がありません。
Rのランダム効果のようなマルコフランダムフィールドスムーザーを適合させることができるかどうかを考えています。ありがとう!