1

R で線形代数を使用して OLS 推定量の手動計算を行っていたところ、R の組み込み回帰関数 lm() に対して別の答えが得られました。なぜ違いがあるのか​​ 誰にも教えてもらえますか?R は OLS を実行していませんか?

> x1<-rbind(1,2,3,4,5)
> x2<-rbind(3,65,7,2,1)
> x3<-rbind(34,7,23,2,4)
> x4<-rbind(25,50,70,90,110)
> y<-rbind(1,2,3,4,5)
> X<-as.matrix(cbind(x1,x2,x3,x4))
> Y<-as.matrix(cbind(y))
> 
> beta.hat<-solve(t(X)%*%X)%*%t(X)%*%Y
> r.regression<-lm(Y~0+X)
> 
> beta.hat
              [,1]
[1,]  1.000000e+00
[2,] -2.595146e-15
[3,]  8.174017e-15
[4,] -2.309264e-14
> r.regression

Call:
lm(formula = Y ~ 0 + X)

Coefficients:
        X1          X2          X3          X4  
 1.000e+00   3.331e-18   4.152e-17  -6.783e-17  
4

1 に答える 1

0

RはOLSを問題なく実行しています。問題はあなたが提供した例にあります。これは、@DWin がコメントしたものに基づいて構築されたデモンストレーションです。

set.seed(1234)
x1 <- rnorm(5,mean=3)
x2 <- rnorm(5,mean=1,sd=5)
x3 <- rnorm(5,mean=7,sd=1)
x4 <- rnorm(5,mean=1,sd=2)

X<-as.matrix(cbind(x1,x2,x3,x4))
Y<-as.matrix(cbind(y))

(beta.hat<-solve(t(X)%*%X)%*%t(X)%*%Y)
lm(Y~X+0)

ご覧のとおり、係数はまったく同じであり、より適切なデータを除いてコードが繰り返されます。

PSこれがトピック外の質問に分類されている場合は、回答も削除してください。私の意図は、コメントに収まらないコードで問題を説明することだけでした。

于 2013-12-11T10:42:56.687 に答える