0

重複の可能性: (stats.SE からのクロスポストですが、代わりに mod によってここに送信されました)
SAS を使用して予測用の SSE を取得するにはどうすればよいですか?

ここに画像の説明を入力

SAS で予測の二乗誤差の合計を取得しようとしていますが、正しく行っているかどうかわかりません。自分のコード (具体的にはstdp )で得られる出力を完全に理解しているかどうかはわかりません。

data tridata;
infile '\data.dat';
    input x1 x2 x3 y;
    proc sort data = tridata; by x3;

proc reg data = tridata;
    model y=x3;
    plot r. * x3;
    output out = tridata2 r = resid p = pred stdp = err;
run;
quit;

/* Send your errors to a file */
data _NULL_;
    file '\data-err.dat';
    set tridata2;
    put err;
    where y eq .;
run;
quit;

これにより、各見積もりの​​エラーのファイルが得られます。これらを Excel に取り込んで、それぞれを 2 乗し、合計して数値を出しました。これは正しい方法ですか?私のプロジェクトの説明に基づいて、予測値ごとに SSE_test を取得する必要があるという印象を受けました。下記参照:

ここに画像の説明を入力

4

1 に答える 1

0

まず、STDP は平均予測値の標準誤差です [これは 95% 信頼/予測区間の計算に使用されます]。これは、SSE を取得するために二乗して合計する必要があるものではありません。

これはあなたがする必要があることです:

PROC REG の出力ステートメントで「r = resid」があった場所は、エラーの尺度です。それは単に実際の予測です。場合によっては、モデルが過剰に予測したり、予測を下回ったりすることがあります。この R (Residual) は、正の値または負の値になる可能性があります。

すべてを正にするために、残差値を 2 乗して、作成した予測ごとに SQUARED ERRORS を取得します。

すべての SQAURED ERRORS を合計すると、SUM OF SQURED ERRORS が得られます。これは単一の統計 (またはスカラー) になります。

私の知る限り、実際の値が手元にない限り、SSE を計算することはできません。

http://en.wikipedia.org/wiki/Errors_and_residuals_in_statistics特にそのページの最後の段落を参照してください。

于 2012-07-29T11:02:29.143 に答える