私は個人の年収を含むパネル データを持っており、個人の年収の傾向、つまり年収の個人係数、および年ごとの各個人の残差 (私のモデルによる予想外の収入の変化) に関心があります。 . ただし、少なくとも 1 年以上にわたって収入データが欠落している観測がたくさんあるため、線形回帰を使用すると、観測の大部分が失われます。データ構造は次のようになります。
caseid<-c(1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,4,4,4,4,4,4)
years<-c(1998,2000,2002,2004,2006,2008,1998,2000,2002,2004,2006,2008,
1998,2000,2002,2004,2006,2008,1998,2000,2002,2004,2006,2008)
income<-c(1100,NA,NA,NA,NA,1300,1500,1900,2000,NA,2200,NA,
NA,NA,NA,NA,NA,NA, 2300,2500,2000,1800,NA, 1900)
df<-data.frame(caseid, years, income)
ランダム効果モデルを使用することにしました。これは、最尤アプローチを使用して、欠落した年の収入を予測できると思います。ただし、Hausman Test は有意な結果を出すため、固定効果モデルを使用することにしました。そして、plm パッケージを使用して、以下のコードを実行しました。
inc.fe<-plm(income~years, data=df, model="within", effect="individual")
ただし、個人ではなく年数の係数のみを取得します。そして、私は残差を得ることができません。おそらくアイデアを与えるために、Stataのコードは
xtest caseid
xtest income year
predict resid, resid
次に、同じライブラリから可変係数の関数である pvcm 関数を実行しようとしました。
inc.wi<-pvcm(Income~Year, data=ldf, model="within", effect="individual")
ただし、次のエラー メッセージが表示されます。
このエラーを解決するか、他の関数を使用して、pvcm で個々の係数と残差を取得するにはどうすればよいですか?
私の元の長い形式のデータには、202976 回の観測と 15 年があります。
また、私が選択した分析方法に関するコメントや提案をいただければ幸いです。どうもありがとうございました。