8

R の学習を始めたばかりで、データの残差の平均と中央値を見つけるのに助けが必要です。lm を計算したところ、次のような残差が得られました。

min       1Q        median  3Q      Max
-111.86   -34.90     -7.6   33.46   182.58

質問: 残差の中央値は -7.6 ですが、私の平均はどれですか? または、残差の平均と中央値を見つけるための計算はありますか? mean(resid(trees.lm) または mean(trees.lm$resid) として入力する必要があります

私のクラスメートは全員、同じデータセットに対して異なる回答を得るので、明確にしてください。

4

1 に答える 1

7

ここでの特定の質問に対する答えは次のとおりです。

mean(resid(trees.lm))

このように当てはめられたモデル オブジェクトを掘り下げて、任意のコンポーネントを取り除くべきではありません。GLM のようなもう少し複雑なものでこれを行うと、次の方法で作業残差を抽出したことに気付いたときに、手を噛むことになります。

glm.mod.obj$residuals

あなたにとって役に立たない可能性があります。

lm()オブジェクトのような単純なものであっても、モデルがどのように適合されたか (たとえば、引数の設定は何だったのか)によって、何を使用resid()またはアクセス$residualsするかが異なる場合があります。na.action

また、線形モデルは、残差が平均 0 と分散 $\hat{\sigma}^2}$ をもつ iid ガウス (または正規) 確率変数であると想定しているため、平均は 0 に非常に近くなります (つまり、非常に、非常に、非常にこれは 0 に近いですが、これはコンピューターであり、浮動小数点演算が行われているため、正確ではありません)。

于 2012-09-17T14:28:23.163 に答える