0

元々 Excel から取得したデータを使用して、R で重回帰を実行しようとしています。lm() 関数を使用して R で回帰を実行しますが、Excel のソルバー アドインの回帰機能を使用して同じ変数セットに対して同じ回帰を実行すると、実質的に異なる結果が得られます。非常に異なる R^ 2つの値、および独立変数の異なる係数。この問題の理由を知っている人はいますか?

ここで手順を明確にします。Excel でデータを作成し、各行がイベント、各列が変数になるように配置します。Excel ファイルのコピーをタブ区切りのテキスト ファイルとして保存します。

frame1<-read.table("Data_file.txt")
x1<-frame1[,2]
x2<-frame1[,3]
x3<-frame1[,4]
x4<-frame1[,5]
x5<-frame1[,6]
x6<-frame1[,7]
x7<-frame1[,8]
x8<-frame1[,9]
y<-frame1[,8]
lm1<-lm(y~x1+x2+x3+x4+x5+x6)
summary(lm1)

as.numeric(x1)すべての x* と y を実行して、R がそれぞれを数値としてインポートしていることを確認しました (TRUE を返します)。

Excel でソルバー アドインを開き、[回帰] を選択し、y と x の範囲を選択して、出力を表示します。R でベクトルを手動で表示して、値が同じであることを確認しました。Excel ファイルの値を丸めて、テキスト ファイルに保存するときや R にインポートするときの丸めが問題にならないことを確認しました。 -それは修正されません。

洞察力のある人なら誰でも大歓迎です。

編集:R出力:

Call:
lm(formula = lnAssdFCexpanded ~ UNRATE + Housing + SP500 + Outstanding + 
    CPI + GDP + libor12 + ACR)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.069644 -0.017137  0.004542  0.014124  0.050276 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  5.403e-01  2.096e+00   0.258  0.79798   
x1       3.509e-03  5.179e-02   0.068  0.94635   
x2     -4.282e-03  4.328e-03  -0.989  0.32893   
x3       -4.812e-05  2.515e-04  -0.191  0.84930   
x4  2.788e-04  3.102e-04   0.899  0.37459   
x5         -1.859e-03  7.254e-03  -0.256  0.79917   
x6          4.769e-06  1.206e-04   0.040  0.96866   
x7     -1.619e-01  1.042e-01  -1.554  0.12871   
x8          1.510e-02  5.427e-03   2.783  0.00844 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.02888 on 37 degrees of freedom
Multiple R-squared:  0.324, Adjusted R-squared:  0.1778 
F-statistic: 2.217 on 8 and 37 DF,  p-value: 0.04849

エクセル出力:

SUMMARY OUTPUT              

Regression Statistics               
Multiple R  0.6585439           
R Square    0.433680069         
Adjusted R Square   0.311232516         
Standard Error  0.026435745         
Observations    46          

ANOVA               
    df  SS  MS  F
Regression  8   0.019801242 0.002475155 3.541761833
Residual    37  0.025857398 0.000698849 
Total   45  0.04565864      

    Coefficients    Standard Error  t Stat  P-value
Intercept   -0.540575382    1.95242173  -0.276874291    0.783417585
X Variable 1    0.00497459  0.047237193 0.105310868 0.916697997
X Variable 2    -0.000348463    0.004154182 -0.083882529    0.933602042
X Variable 3    -0.000140051    0.000229284 -0.610818478    0.545054069
X Variable 4    0.000111365 0.000280844 0.396536602 0.693987066
X Variable 5    -0.002129205    0.006640379 -0.3206451  0.750283376
X Variable 6    5.79194E-05 0.000111833 0.51790939  0.607604647
X Variable 7    -0.16469405 0.093923869 -1.753484509    0.087800642
X Variable 8    0.034494338 0.008515322 4.050855618 0.000250969
4

0 に答える 0