360 個の観測値のセットで、150 個までの固定効果変数と 7 個の変量効果変数の間でモデル選択を実行したいと考えています。glmmLasso を使用して、混合モデルに Lasso 手順を使用することにしました。成功しなかった同等のモデルの例をいくつか見つけるために、私は多くの研究を行いました。これが私のデータのサンプルです:
> str(RHI_12)
'data.frame': 350 obs. of 164 variables:
$ RHI_counts_12 : int 0 14 1 3 2 2 2 0 0 1 ...
$ Site : Factor w/ 6 levels "14_metzerlen",..: 1 1 1 1 1 1 1 1 1 1 ...
$ Location : Factor w/ 30 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
$ Dist_roost : num 0.985 0.88 0.908 0.888 0.89 ...
$ Natural_light : num -0.194 -0.194 -0.194 -0.194 -0.194 ...
$ Mean_wind : num 0.836 0.836 0.836 0.836 0.836 ...
$ Mean_temp : num -0.427 -0.427 -0.427 -0.427 -0.427 ...
$ Day : num -0.993 -0.993 -0.993 -0.993 -0.993 ...
$ Artificial_light: num -0.2016 -0.2016 0.0772 -0.2016 -0.2016 ...
$ WBdi : num 1.14 1.14 1.14 1.14 1.14 ...
$ WCdi : num 1.49 1.49 1.49 1.49 1.47 ...
... (many more fixed-effect variables)
応答変数はカウント (RHI_counts_12) です。
私の質問は、モデル内の変量効果変数の構造についてです。2 つのカテゴリ変量効果変数 ("Site" と "Location"; "Location" は "Site" にネストされています) と 5 つの数値変量効果変数があります。モデルを次のように構成しました (固定効果変数のサンプルのみを使用)。
lasso1<-glmmLasso(RHI_counts_12 ~ Artificial_light+WBdi+WCdi+BUdi+FOdi+TIdi, list(Site=~1,Location=~1+Dist_roost+Natural_light+Mean_wind+Mean_temp+Day),
lambda = 500,family = poisson(link = log), data = RHI_12)
これらの 2 つのカテゴリカル ネストされたランダム効果がある場合、ランダム効果を構造化する正しい方法についてはまったく確信が持てません。Site にネストされた Location を持つモデルが必要ですが、これが得られるとは思いません。ランダム効果の出力は次のとおりです (この出力では、「Loc」は場所を表し、「siteName」はサイトを表します)。
Random Effects:
StdDev:
[[1]]
siteName
siteName 1.180514
[[2]]
Loc Loc:Dist_roost Loc:Natural_light Loc:Mean_wind
Loc 1.15105859 -0.66317669 -0.35354821 -0.10805268
Loc:Dist_roost -0.66317669 1.42601945 0.46004662 -0.42795987
Loc:Natural_light -0.35354821 0.46004662 0.49532786 -0.15485395
Loc:Mean_wind -0.10805268 -0.42795987 -0.15485395 0.76175417
Loc:Mean_temp 0.02677276 0.03961902 -0.01431360 -0.03649499
Loc:Day 0.03756960 -0.02081360 0.02520654 -0.12082652
Loc:Mean_temp Loc:Day
Loc 0.02677276 0.03756960
Loc:Dist_roost 0.03961902 -0.02081360
Loc:Natural_light -0.01431360 0.02520654
Loc:Mean_wind -0.03649499 -0.12082652
Loc:Mean_temp 0.36923939 -0.08311209
Loc:Day -0.08311209 0.56876662
それは正しいと思いますか。「サイト」にネストされた「場所」を使用してこのモデルを構築することはできませんでした (他のすべてのランダム要因も「サイト」にネストされます)。さまざまな方法を試しましたが成功しませんでした。
私を読んでくれて、そして glmmLasso のランダム効果の構造についてアドバイスをくれてありがとう!:-)
トーマス