0

私は R を使用lm()して、収集したデータに (を使用して) いくつかの線形モデルを作成しています。現在、私は統計が苦手で、R によって生成された線形モデルの概要を理解するのが難しいと感じています。

私は残余価値を意味します: Min, 1Q, Median, 3Q,Max

私の質問は次のとおりです: これらの値は何を意味し、これらの値からモデルが適切かどうかをどのように知ることができますか?

これは私が持っている残りの値の一部です。

Min: -4725611 1Q:-2161468 median:-1352080  3Q:3007561 Max:6035077
4

1 に答える 1

3

線形回帰 (および特に関連する仮説検定) の基本的な仮定の 1 つは、残差が期待値ゼロの正規分布であるということです。統計は非常に堅牢であるため、この仮定にわずかに違反しても問題はありません。ただし、分布は少なくとも対称的である必要があります。

正規性の仮定が満たされているかどうかを判断する最良の方法は、残差をプロットすることです。さまざまな診断プロットを利用できます。たとえば、次のことができます。

fit <- lm(y~x)
plot(fit)

これにより、残差対適合値のプロットと、標準化された残差の qq プロットが得られます。で与えられる分位点summary(fit)は、残差が対称かどうかをすばやく確認するのに役立ちます。そこでは、最小値と最大値はそれほど重要ではありませんが、中央値はゼロに近く、第 1 四分位と第 3 四分位は同様の絶対値を持つ必要があります。もちろん、このチェックは、十分な数の値がある場合にのみ意味があります。

残差が正規分布していない場合、それに対処するいくつかの可能性があります。

  • 変換、
  • 一般化線形モデル、
  • または非線形モデルがより適切である可能性があります。

線形回帰に関する優れた書籍が多数あり、優れた Web チュートリアルもいくつかあります。そのうちの少なくとも 1 つを注意深く読むことをお勧めします。

于 2012-08-28T11:35:30.727 に答える