2

反復測定を使用して、データセットに対して混合効果モデルを開発しようとしています。

MetTreatは、3 つの処理 ( 、レベルcucおよび) に提出された 24 のサンプルでランダムに選択された一連の日に測定されますga

Met日中の気象条件の違いによる変化の程度( Date)。したがって、日付はモデルの 2 番目のランダム効果になります (サンプリングされたアイテム ( ) とともにID)。

私の主な関心は、日Treatごとに有意な影響があるかどうかを確認することMetです。

いくつかのサンプルデータ:

# create example data frame 
ID     <-  factor(rep(c("a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x"), 6))
Treat  <-  factor(rep(c(rep("c",8), rep("uc",8), rep("ga",8)), 6))
Date   <-  factor(rep(c(rep("10/06/2007",24), rep("19/06/2007",24), rep("12/07/2007",24), rep("21/07/2007",24), rep("11/08/2007",24), rep("12/08/2007",24)), 1))
Met    <-  as.numeric(c(rnorm(8,5,2),   rnorm(8,7,2),   rnorm(8,9,2), 
                        rnorm(8,15,2),  rnorm(8,17,2),  rnorm(8,19,2),
                        rnorm(8,9,2),   rnorm(8,11,2),  rnorm(8,13,2),
                        rnorm(8,8,2),   rnorm(8,10,2),  rnorm(8,12,2),
                        rnorm(8,2,2),   rnorm(8,4,2),   rnorm(8,6,2),
                        rnorm(8,3,2),   rnorm(8,5,2),   rnorm(8,7,2)))
ww     <-  gl(1,1,144)

lys.data  <-  data.frame(ID, Treat, Date, Met, ww)
head(lys.data)

# set contrasts of data frame
lys.data$Treat   <-  factor(lys.data$Treat,     levels=c("c", "uc", "ga"))

次に分析:

library(nlme)
lme.001  <-  lme(Met ~ Treat, data = lys.data,
                 random=list(ww=pdBlocked(list(pdIdent(~Date-1),
                             pdIdent(~ID-1)))))
summary(lme.001)

私が得た結果から、自由度が正しくないように見えるため(高すぎる)、私が行っていると想定していることを行っていないようです。分母の自由度の数は、実験の繰り返し回数 (日付) に応じて増加するというのは正しいですか?

ここで私を助けたり、正しい方向に向けたりできるのは誰ですか? データの入れ子を表現する方法に問題がありますか? (私は何もないと仮定します)。

4

1 に答える 1

3

分母の自由度を計算するためにを使用するルールlmeについては、p. Pinheiro and Bates (2000) の 91 - このページはたまたまGoogle Booksで入手できます。(そのリンクはGLMM FAQ ページにもあります。)

更新: これは Google ブックスで有用な形式で利用できなくなったように思われるため、重要な段落のテキストを次に示します。

これらの固定効果項の条件付き検定には、分母の自由度が必要です。条件付き $F$ テストの場合、分子の自由度も必要であり、項自体によって決定されます。分母の自由度は、項が推定されるグループ化レベルによって決まります。グループ化因子の特定のレベル内でその値が変化する可能性がある場合、項は因子に対して内部相対と呼ばれます。グループ化因子のレベル内でその値が変化しない場合、項はグループ化因子の外側にあります。項が $i-1$ 番目のグループ化因子の内側にあり、$i$ 番目のグループ化因子の外側にある場合、項はレベル $i$ で推定されると言われます。たとえばMachinefm2Machineモデル内の項は、外部Machine %in% Workerと内部です。Workerであるため、レベル 2 ( Machine %in% Worker) と推定されます。項がモデル内のすべての $Q$ グループ化因子の内部にある場合、グループ内エラーのレベルで推定されます。これを $Q+1$st レベルと呼びます。

モデル行列 $X_i$ のすべてが 1 の列に対応するパラメーターである切片は、存在する場合、他のすべてのパラメーターとは異なる方法で処理されます。パラメータとしては、すべてのグループ化要因の外側にあるため、レベル 0 で推定されていると見なされます。ただし、その分母の自由度は、レベル $Q+1$ で推定されたかのように計算されます。これは、切片が、$X_i$ の対応する列がレベルによって変化しない場合でも、レベルのすべての観測からの情報をプールする 1 つのパラメーターであるためです。

$m_i$ がレベル $i$ のグループの総数を表すとします (固定効果モデルに切片が含まれる場合は $m_0=1$、それ以外の場合は 0 であり、$m_{Q+1}=N$ という規則に従います)。 $p_i$ は、レベル $i$ で推定された項に対応する自由度の合計を示し、$i$ 番目のレベル分母の自由度は次のように定義されます。

$$ denDF_i = m_i - (m_{i-1} + p_i), i = 1, \dots, Q $$

この定義は、バランスの取れたマルチレベル ANOVA 計画における自由度の古典的な分解と一致し、より一般的な混合効果モデルの合理的な近似を提供します。

私はあなたの例を詳細にチェックしていませんが、問題は、厳密にネストされたデザインではなくランダム化されたブロック デザインを使用しているため、自由度が思ったよりも高いことが強く疑われます。一般に、残差/分母の df は、ネストされた設計に典型的な (ブロック数-1) ではなく、(ブロック数-1)*(ブロックあたりの数-1)です。 、 例えば。

一方、lme設計が十分に複雑な場合は、間違っている可能性があります。その場合、自分で解決する必要がある、単純な解決策が存在しない可能性があります。繰り返しになりますが、アドバイスについてはGLMM faqを参照してください。

于 2013-01-16T18:04:36.683 に答える