2

Python StatsModels で線形回帰を取得して、負の勾配を持つデータ シリーズに適合させることができません。RLM も OLS も機能していません。-1 の勾配が予想される非常に単純なケースを考えてみましょう。

In [706]: ts12 = pandas.TimeSeries(data=[5,4,3,2,1],index=[1,2,3,4,5])
In [707]: ts12_h = sm.RLM(ts12.values, ts12.index, M=sm.robust.norms.HuberT())
In [708]: ts12_fit = ts12_h.fit()
In [710]: ts12_fit.fittedvalues
Out[710]: array([ 0.62321739,  1.24643478,  1.86965217,  2.49286956,  3.11608696])

In [729]: ts12_fit.params
Out[729]: array([ 0.62321739])

In [733]: ts12_ols = sm.OLS(ts12.values, ts12.index)
In [734]: ts12_ols_fit = ts12_ols.fit()
In [736]: ts12_ols_fit.fittedvalues
Out[736]: array([ 0.63636364,  1.27272727,  1.90909091,  2.54545455,  3.18181818])

RLM と OLS の両方の適合パラメータは 0.6 の勾配を示します...そして適合値はそれを上向きの傾向で反映しています。scipy からの通常の最小二乗回帰は、勾配が -1 の予想される結果を示します。

In [737]: from scipy import stats
In [738]: stats.linregress([1,2,3,4,5], [5,4,3,2,1])
Out[738]: (-1.0, 6.0, -1.0, 1.2004217548761408e-30, 0.0)

明らかな何かが欠けているに違いありませんが、通常の手段では何も見つかりません。

4

1 に答える 1