1

R スクリプトで lm を使用して、いくつかの点で線形近似を取得することを学びました。それで、私はそれを行い(うまくいきました)、フィットを出力しました:

lm(formula = y2 ~ x2)

Residuals:
         1          2          3          4 
 5.000e+00 -1.000e+01  5.000e+00  7.327e-15 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept)   70.000     17.958   3.898  0.05996 . 
x2            85.000      3.873  21.947  0.00207 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Residual standard error: 8.66 on 2 degrees of freedom
Multiple R-squared: 0.9959, Adjusted R-squared: 0.9938 
F-statistic: 481.7 on 1 and 2 DF,  p-value: 0.00207 

この適合性がどれほど優れているかを判断する最善の方法を決定しようとしています。この適合を他のいくつかの適合と比較する必要があります (これもlm()関数を使用して線形です)。この要約のどの値が、この適合度を判断する最良の方法でしょうか? 残差標準誤差を使用することを考えていました。助言がありますか。また、フィット変数からその値を抽出するにはどうすればよいですか?

4

3 に答える 3

2

このコードは、次のようなことを行います。

 y2 <- seq(1, 11, by=2)+rnorm(6)  # six data points to your four points
 x2=1:6
 lm(y2 ~ x2)
 summary(lm(y2 ~ x2))

調整された R^2 は、「適合度」の尺度です。y2 の分散の 99% は、y2 から x2 への直線近似によって「説明」できると言っています。その結果に基づいて 4 つのデータ ポイントのみでモデルを解釈するかどうかは、判断の問題です。私には少し危険に思えます。

使用する平方和の残差を抽出するには、次のようにします。

summary(lm(y2~x2))$sigma

詳細については、これを参照してください。

?summary.lm
于 2011-08-18T21:44:14.403 に答える
2

summaryによって生成された部分に直接アクセスしたい場合は、呼び出しsummaryて結果を変数に格納し、結果のオブジェクトを調べることができます。

rs <- summary(lm1)
names(rs)

おそらくrs$sigmaあなたが探しているものですか?

編集

誰かが私をからかう前に、この情報の一部については、これが推奨されるアクセス方法ではないことを指摘しておく必要があります。residuals()むしろ、またはのような指定されたエクストラクタを使用する必要がありますcoef

于 2011-08-18T21:51:45.407 に答える
1

あなたが見ることができるいくつかの素晴らしい回帰診断プロットがあります

plot(YourRegression, which=1:6)

where which=1:6 は、6 つのプロットすべてを提供します。RESET テストと bptest は、仕様の誤りと不均一分散をテストします。

resettest(...)
bptest(...)

この種のことを考えるためのリソースはたくさんあります。R での分布の適合 はその 1 つであり、Faraway の「Practical Regression and Anova」は R の古典です。私は基本的にファーンズワースの論文/本から R の計量経済学を学びましたが、彼が適合度について何か知っているかどうかは思い出せません。

R で多くの計量経済学を行う場合は、Applied Econometrics in Rが優れた有料の本です。また、R for Economistsの Web ページを頻繁に使用しています。

それらは頭に浮かぶ最初のものです。もう少し熟考します。

于 2011-08-18T21:31:32.390 に答える