1

残念ながら、私はこの統計の分野に精通していません...実際には計算が必要でした(すぐに解決できるものを探しているわけではありません)が、それらが正しいかどうかはわかりません。また、私の考え方もありますので、間違いを指摘していただければ幸いです。

これは偽のデータで、犬と猫の成長率を示しています (完全にでっちあげ):

time <- c(1,2,3,4,5,6,7,8,9,10,1,2,3,4,5,6,7,8,9,10)
a <- rep('dog', 10)
b <- rep('cat', 10)
animal <- c(a,b)
val <- c(2.00,8.00,17.00,21.00,29.00,37.00,41.00,56.00,67.00,82.00,1.00,3.00,6.00,8.00,11.00,15.00,21.00,26.00,31.00,37.00)
data <- data.frame(time,animal,val)

もっとよく見なさい:

require(ggplot2)
ggplot(data, aes(time, val, color=animal)) +
  stat_summary(fun.data=mean_se, geom="pointrange") +
  geom_point()

ここに画像の説明を入力

犬は猫よりも早く成長することがわかるように、これは私の仮説かもしれません。ただし、それを準拠させるためにいくつかの統計を行う必要があります。

そこで、Growth Curve Analysis (GCA)を実行することにしました。私はこのチュートリアルに基づいていました。私の結果の下に簡単な説明があります。

まず最初に、各動物のランダム インターセプトの基本モデルを作成しました。

m.base <- lmer(val ~ time + (1 | animal), data=data, REML = F)

そして、ここに問題があります。実際、ここには固定効果はありません。私のデータセットは単純です。知りたいのは、両方のグループ (犬と猫) の時間の成長率が統計的に有意に異なることだけです。言い換えると。 この期間中、動物の成長率は異なっていましたか?

したがって、追加の固定効果として動物を配置します。

m.1 <- lmer(val ~ time * animal + (1 | animal), data=data, REML = F)

ここで、統計的に有意な差があるかどうかを確認するために、ANOVA を使用して両方のモデルを比較しました。

    > anova(m.base,m.1)
Data: data
Models:
m.base: val ~ time + (1 | animal)
m.1: val ~ time * animal + (1 | animal)
       Df    AIC    BIC  logLik deviance  Chisq Chi Df Pr(>Chisq)    
m.base  4 151.43 155.41 -71.714   143.43                             
m.1     6 116.29 122.26 -52.145   104.29 39.138      2  3.171e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

今、私は混乱しており、これらの分析、いくつかの質問のすべてを完全には理解していません...

この値3.171e-09は、私のグループの成長率が統計的に有意であることを示していますか?

別のモデルを作りましょうか:

m.0 <- lmer(val ~ time + animal + (1 | animal), data=data, REML = F)

モデルのテストを実行しますか?

> anova(m.base,m.0,m.1)
Data: data
Models:
m.base: val ~ time + (1 | animal)
m.0: val ~ time + animal + (1 | animal)
m.1: val ~ time * animal + (1 | animal)
       Df    AIC    BIC  logLik deviance   Chisq Chi Df Pr(>Chisq)    
m.base  4 151.43 155.41 -71.714   143.43                              
m.0     5 145.58 150.56 -67.789   135.58  7.8499      1   0.005082 ** 
m.1     6 116.29 122.26 -52.145   104.29 31.2884      1  2.224e-08 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

自分の仮説を確認できるのはどの値ですか?

私の間違い、手がかり、説明を指摘してくれてとても感謝しています!

4

1 に答える 1

4

各データ ポイントは異なる動物からのものであると想定しています。2 匹の動物からのデータしかない場合、これら 2 匹の動物を比較することしかできず、2 つの個体群について何も推測することはできません。複数の動物からのデータがあり、各動物が繰り返し測定された場合、実際には混合効果モデルが必要になります。しかし、上記の私の仮定では、それは必要ありません。

ドメイン固有の理論からパラメトリック モデルを使用して、 を使用できるようになりnlme::gnlsました。その関数は基本的に、パラメーターが他の変数の線形モデルである非線形モデルに適合します(あなたの場合は動物の種類)。次に、これらの線形モデルのパラメーターの有意性をテストできます。これは、summaryメソッドによって行われます。測定を繰り返した場合は、nlme::nlmeこれを混合効果モデルに拡張します。

もう 1 つのアプローチは、ノンパラメトリック モデルです。

library(mgcv)
mod1 <- gam(val ~ s(time, k = 4), data = data, select = TRUE)
mod2 <- gam(val ~ animal + s(time, k = 4, by = animal), data = data, select = TRUE)
#we need the parametric effect because smoothers are centered

#compare both models, not sure which test is more appropriate, 
#let's just do both Chisq and F
anova(mod1, mod2, test = "Chisq")
anova(mod1, mod2, test = "F")
#significant difference between animal types
#plots show which one grows faster
gam.check(mod2)
plot(mod2)
summary(mod2)

必要に応じて、これを混合効果モデルに拡張することもできます。

于 2018-08-07T08:41:25.653 に答える