wls_prediction_std は、当てはめたモデル データの標準偏差と信頼区間を返します。共分散行列から信頼区間を計算する方法を知る必要があります。(私はすでにソース コードを見て理解しようとしましたが、できませんでした) wls_prediction_std の背後にある数式を書き出すことで、皆さんの何人かが私を助けてくれることを期待していました。
1 に答える
ウェイトなしで、どの教科書にもこれに関するバリエーションがあるはずです。
OLSの場合、Greene(私が使用した第5版)には
se = s^2 (1 + x (X'X)^{-1} x')
ここで、s^2 は残差分散の推定値、 はx
予測対象のベクトルまたは説明変数X
、 は推定に使用される説明変数です。
これは観測値の標準誤差であり、2 番目の部分だけが予測平均の標準誤差ですy_predicted = x beta_estimated
。
wls_prediction_std
パラメータ推定値の分散を直接使用します。
x が固定されていると仮定すると、y_predicted は確率変数 の線形変換にすぎbeta_estimated
ないため、の分散y_predicted
は
x Cov(beta_estimated) x'
これに、誤差分散の推定値を追加する必要があります。
私が覚えている限りでは、より良い小さなサンプルの特性を持つ見積もりがあります。
重みを追加しましたが、検証できなかったため、関数は何年もの間サンドボックスに残っていました。(Stata は重み付きの予測エラーを返しません。)
余談:
サンドイッチ ロバスト共分散推定量を使用する場合、パラメーター推定の共分散を使用することも正しいはずですが、上記のグリーンの式は、誤って指定された不均一分散がない場合にのみ正しいです。
wls_prediction_std
考慮されていないのは、不均一分散のモデルがある場合、エラー分散も説明変数、つまり x に依存する可能性があるということです。