1

私は雇用データのいくつかの軽い非抑制を行っており、zoo パッケージの na.approx アプローチに出くわしました。このデータは、政府の総雇用数の割合を表しており、大まかな見積もりは、州政府と地方政府の間の変化の傾向を見ることになると考えました. それらは1つに追加する必要があります。

        State % Local %
2001    na  na
2002    na  na
2003    na  na
2004    0.118147539 0.881852461
2005    0.114500321 0.885499679
2006    0.117247083 0.882752917
2007    0.116841331 0.883158669

主要なナの推定を可能にするスプライン設定を使用します

z <- zoo(DF2,1:7)    
d<-na.spline(z,na.rm=FALSE,maxgap=Inf)

出力は次のとおりです。

State % Local %
0.262918013 0.737081987
0.182809891 0.817190109
0.137735231 0.862264769
0.118147539 0.881852461
0.114500321 0.885499679
0.117247083 0.882752917
0.116841331 0.883158669

いいでしょ?私を驚かせたのは、近似された na 値の合計が 1 になることです (これは私が望んでいるものですが、予想外です!) しかし、na.approx のドキュメントには、各列を個別に列ごとに行うと書かれています。何か不足していますか?私のお金はドキュメントの読み間違いにあります

4

1 に答える 1

2

私はそれが線形最小二乗法の偶然の性質だと信じています。系列の合計が 1 に等しいという制約の結果として、両方の回帰の合計の傾きはゼロになります。切片の合計は 1 になります。したがって、任意の時点での両方の回帰からの適合値の合計は 1 になります。

編集:もう少し説明。
y1 = a + beta * t + epsilon
y2 = 1-y1 = (1-a) + (- beta) * t - epsilon
したがって、OLS を実行すると、切片の合計が 1 になり、傾きが 0 になります。

于 2011-02-06T21:28:02.840 に答える