6

この出力の p 値が何を意味するのかよくわかりません。p値そのものを意味するわけではありませんが、この場合は.

> Model 1: sl ~ le + ky 
> Model 2: sl ~ le   
  Res.Df     RSS Df   Sum of Sq      F Pr(>F) 
1     97 0.51113                              
2     98 0.51211 -1 -0.00097796 0.1856 0.6676

私はそのようなものを手に入れました. p値は2つではなく1つしかないため、混乱しています。summary(model1) または summary(model2) を使用して異なる pvalue を取得します

今なら

> fm2<-lm(Y~X+T)

(T は指標変数) と

> fm4<-lm(Y~X)

私が行った場合

> anova(fm2,fm4)

これは、帰無仮説H0: alpha1==alpha2 (Ha: alpha1!=alpha2)c(alpha は私の切片です) をテストしalpha1==alpha2ますalpha1!=alpha2

この場合、p 値が 0.6676 であるため、明らかに帰無仮説を棄却します。

これは、モデルに固執する必要があることを意味しfm4ます。これは、データにより適しているためです。

私は結論を正しく導きましたか?最善を尽くしましたが、p値が何を意味するのかわかりません。オンしかないので、これは私がそれを意味するかもしれないと思ったものです。誰かが物事を片付けることができますか?

4

1 に答える 1

6

「帰無仮説を明らかに拒否しない」(「今は明らかに拒否する」ではなく)という意味ですか? あなたの質問の残りの部分を考えると、それはより理にかなっているように思えます。

比較するモデルが 2 つあるため、p 値は 1 つしかなく、単一の比較 (帰無仮説と対立仮説、またはこの場合は帰無仮説と未指定の対立仮説) になります。あなたが上で言ったことからle、連続的でkyカテゴリカルな予測因子であるかのように聞こえます。その場合、勾配と切片を持つモデルを(あなたが言ったように)単一の勾配と2つの切片を持つモデルと比較しています。p 値が比較的大きいため、データが の相加効果の証拠を提供していないことを意味しますky。一般的には、より単純なモデルの方が適切です (ただし、p 値は仮説を検証するために作成されたものであり、モデルの中から選択するためのものではないため、この結論には注意してください)。

個々のモデルごとに得られるsummary()p 値は、各モデルの各パラメーターの効果の p 値であり、そのモデルの他のすべてのパラメーターを条件としています。データが完全にバランスが取れている場合summary(回帰計画ではありそうにない)、とから同じ答えが得られるはずですがanova、それ以外の場合は からの結果anovaが一般的に望ましいものです。

この質問はおそらくhttp://stats.stackexchange.comに適しています。これは、実際にはプログラミングではなく統計的解釈に関するものです...

于 2012-10-12T18:46:06.830 に答える