r - 残差と残りの変数のプロット

Question

現在、R のコマンドに基づくスクリプトを使用してpairs、特定のモデルの残差と残りの変数との関係を見つけています。この関係は、モデルの診断にとって重要な場合があります。現在関係をプロットしている方法の小さな例については、以下のコードを参照してください。

モデルに多くの変数 (たとえば ~10) がある場合、pairsプロットは非常に大きくなります。pairs残差との関係を示すプロットの一番下の行のみを見ているため、プロットを大幅に単純化できます。ペアプロットの一番下の行のみをプロットするコマンドなどを推奨できますか?

新しいプロット方法が、非常に広いプロットの代わりに残差分析にグリッドを使用できれば素晴らしいことです。

gpa <- read.delim("GPA.txt", dec = ",")
mod <- lm(CGPA ~ HSGPA + Studytime, data = gpa)
pairs(cbind(gpa, residuals(mod)), panel=panel.smooth)
dput(gpa)

dput(gpa) からの出力

structure(list(Studytime = c(7, 2, 4, 3.5, 4.5, 3, 3, 8, 5.5, 
5.5, 5, 7, 9, 4, 10, 3, 3, 3.5, 4.5, 3.5, 2, 6, 6, 4, 3, 4, 10, 
4.5, 7, 5, 3, 8, 5, 8, 4.5, 2, 3, 6, 10, 2, 12, 5, 4, 3, 4, 4, 
4, 5, 15, 4.5, 4, 4, 5, 5, 6, 3, 3, 2, 2.3), HSGPA = c(3.9, 3.79, 
3, 3.9, 3.6, 3.2, 3.78, 3.2, 3.5, 3.8, 3.89, 3.8, 4, 3.3, 3.7, 
3.9, 3.5, 3.9, 4, 3.5, 3.79, 3.9, 3.5, 3.8, 4, 3.5, 2.55, 3.8, 
4, 4, 4, 3.8, 4, 4, 4, 4, 4, 3.86, 4, 4, 3.9, 4, 4, 4, 4, 4, 
4, 4, 4, 3.7, 3.75, 3.94, 3.9, 3.9, 4, 3.97, 4, 4, 3.6), CGPA = c(3.3, 
3.13, 3.6, 3.5, 3.5, 3.75, 3.47, 2.8, 2.88, 3.28, 3.53, 3.5, 
3.98, 2.6, 3.5, 3.98, 3.75, 3.67, 3.75, 3.9, 3.1, 3.14, 3.8, 
3.7, 3.87, 3.31, 3.14, 2.98, 4, 3.77, 4, 3.49, 3.99, 3.78, 3.92, 
3.77, 3.83, 3.86, 3.86, 3.93, 3.91, 4, 3.73, 3.75, 3.99, 3.8, 
3.77, 3.95, 3.74, 3.65, 3.83, 4, 3.2, 3.6, 3.75, 3.77, 3.83, 
3.7, 2.5)), .Names = c("Studytime", "HSGPA", "CGPA"), class = "data.frame", row.names = c(NA, 
-59L))

score 1 · Accepted Answer

残差 (y 軸) を他の変数に対してプロットし、panel.smoothメソッドを含めるには、次のコードを使用できますn(この場合は 3 つの) 異なるプロットが得られます。

# plotting just the lowest plots
sapply(1:ncol(gpa), function(i) {
  plot(x = gpa[, i], y = residuals(mod), xlab = names(gpa)[i])
  panel.smooth(x = gpa[, i], y = residuals(mod))
})

プロットを 1 ページに表示したい場合は、それを調整できますpar(mfrow = c(2,2))(2x2 のプロットマトリックスが得られます)。

r - 残差と残りの変数のプロット

1 に答える 1

Related

Reference