4

この質問は構文とセマンティクスの両方に関するものであるため、Cross-Validated で (まだ回答されていない) 重複を見つけてください: https://stats.stackexchange.com/questions/113324/repeated-measures-anova-ezanova-vs-aov-vs -lme-syntax

機械学習の分野では、同じ 5 つのデータセットで 4 つの分類子を評価しました。つまり、各分類子はデータセット 1、2、3、...、および 5 のパフォーマンス測定値を返しました。パフォーマンス。おもちゃのデータは次のとおりです。

Performance<-c(2,3,3,2,3,1,2,2,1,1,3,1,3,2,3,2,1,2,1,2)
Dataset<-factor(c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5))
Classifier<-factor(c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4))
data<-data.frame(Classifier,Dataset,Performance)

教科書に従って、反復測定の一元配置分散分析を実施しました。私はパフォーマンスを従属変数、分類子を被験者、データセットを被験者内因子として解釈しました。aovを使用して、私は得ました:

model <- aov(Performance ~ Classifier + Error(factor(Dataset)), data=data)
summary(model)

次の出力が生成されます。

Error: factor(Dataset)
           Df Sum Sq Mean Sq F value Pr(>F)
Residuals  4    2.5   0.625               

Error: Within
            Df Sum Sq Mean Sq F value Pr(>F)  
Classifier  3    5.2  1.7333   4.837 0.0197 *
Residuals  12    4.3  0.3583 

線形混合効果モデルを使用すると、同様の結果が得られます。

model <- lme(Performance ~ Classifier, random = ~1|Dataset/Classifier,data=data)
result<-anova(model)

次に、Sphericity の Mauchlys 検定を実行するために、ezANOVA で結果を再現しようとしました。

 ezANOVA(data=data, dv=.(Performance), wid=.(Classifier), within=.(Dataset), detailed=TRUE, type=3)

次の出力が生成されます。

        Effect DFn DFd  SSn SSd         F          p p<.05       ges
 1 (Intercept)   1   3 80.0 5.2 46.153846 0.00652049     * 0.8938547
 2     Dataset   4  12  2.5 4.3  1.744186 0.20497686       0.2083333

これは明らかに、aov/lme を使用した以前の出力とは一致しません。それでも、ezANOVA 定義で「パフォーマンス」を「分類子」に置き換えると、期待どおりの結果が得られます。

私の教科書が間違っているのか (aov の定義)、それとも ezANOVA の構文を誤解しているのか、疑問に思っています。さらに、なぜ ezANOVA ステートメントを書き直したときに Mauchly のテスト結果しか得られず、最初のケースでは得られないのでしょうか?

4

1 に答える 1

7

データセットではなく分類子を比較したいので、inside factor は分類子で、inside ID はデータセットです。したがって、ezANOVA の例の正しい構文は次のようになります。

ezANOVA(data=data, dv=.(Performance), within=.(Classifier), wid=.(Dataset), detailed=TRUE)

ところで、平方和のタイプを指定する必要はありません。因数が 1 つしかないため、すべての種類の平方和で同じ結果が得られます。

于 2014-08-27T08:12:14.393 に答える