更新は、より最近の2番目の回答を参照してください。一部のモデルと結果クラスにはget_prediction
、予測平均の予測区間や信頼区間などの追加情報を提供するメソッドが追加されました。
古い答え:
iv_l
iv_u
各ポイントの予測間隔の制限を示します。
予測区間は観測値の信頼区間であり、誤差の推定値が含まれます。
平均予測の信頼区間はまだ利用できないと思いますstatsmodels
。(実際には、適合値の信頼区間はinfluence_outlierのsummary_table内に隠されていますが、これを確認する必要があります。)
統計モデルの適切な予測方法は、TODO リストにあります。
添加
OLS には信頼区間がありますが、アクセスは少し扱いにくいです。
スクリプトの実行後に含めるには:
from statsmodels.stats.outliers_influence import summary_table
st, data, ss2 = summary_table(re, alpha=0.05)
fittedvalues = data[:, 2]
predict_mean_se = data[:, 3]
predict_mean_ci_low, predict_mean_ci_upp = data[:, 4:6].T
predict_ci_low, predict_ci_upp = data[:, 6:8].T
# Check we got the right things
print np.max(np.abs(re.fittedvalues - fittedvalues))
print np.max(np.abs(iv_l - predict_ci_low))
print np.max(np.abs(iv_u - predict_ci_upp))
plt.plot(x, y, 'o')
plt.plot(x, fittedvalues, '-', lw=2)
plt.plot(x, predict_ci_low, 'r--', lw=2)
plt.plot(x, predict_ci_upp, 'r--', lw=2)
plt.plot(x, predict_mean_ci_low, 'r--', lw=2)
plt.plot(x, predict_mean_ci_upp, 'r--', lw=2)
plt.show()
これにより、SAS と同じ結果が得られるはずです。http://jpktd.blogspot.ca/2012/01/nice-thing-about-seeing-zeros.html