バックグラウンド
現在、多重予測線形モデルを作成し、診断プロットを生成して回帰の仮定を評価しています。(これは、私が現在愛用している重回帰分析の統計クラスのためのものです:-)
私の教科書 (Cohen、Cohen、West、および Aiken 2003) では、次のことを確認するために、各予測子を残差に対してプロットすることを推奨しています。
- 残差は予測子と体系的に共変しません
- 残差は、モデル内の各予測子に関して等分散です
ポイント(2)について、私の教科書には次のように書かれています。
一部の統計パッケージでは、アナリストは、残差の平均 (0 ライン)、平均よりも 1 標準偏差、残差の平均よりも 1 標準偏差が低い位置に最も低い適合ラインをプロットできます。例}、2 つの線 {mean + 1sd および mean - 1sd} は、lowess {0} 線とほぼ平行のままであり、残差の分散が X の関数として変化しないという解釈と一致しています (p. 131)。
レスラインを変更するにはどうすればよいですか?
「0-line」で散布図を生成する方法を知っています。
# First, I'll make a simple linear model and get its diagnostic stats
library(ggplot2)
data(cars)
mod <- fortify(lm(speed ~ dist, data = cars))
attach(mod)
str(mod)
# Now I want to make sure the residuals are homoscedastic
qplot (x = dist, y = .resid, data = mod) +
geom_smooth(se = FALSE) # "se = FALSE" Removes the standard error bands
しかし、0行、「平均+ 1sd」および「平均-1sd」の行が重ねられるプロットを使用ggplot2
および生成する方法を知っている人はいますか? qplot
それは奇妙な/複雑な質問ですか?