私は、2 年ごとに実施される全国調査に基づいた DF を持っています。期間は 2010 年から 14 年で、少なくとも 2 回登場する人物のみを取得するために df をフィルター処理しました。このように、パネル df がありますが、バランスが取れていません。
どの変数が補完的年金への参加に影響を与えるかを調査するために回帰を実行します (私の国では任意です)。片側固定効果回帰を実行しましたが、今度は両側固定効果回帰 (個人と時間の両方) を実行したいと考えています。
個々の変数は uid で、時間変数は年です。rでplmパッケージを使用しました:
df.p <- plm.data(df, c("uid", "year")
回帰を実行します。
reg1 <- plm(pens ~ woman + age + I(age^2/100) + high + medium + nord + centre, model="within", effect="twoways", data=df.p)
ここで、high と medium は教育レベルに関するダミーで、nor と center は地理的な場所に関するダミーです。簡単にするために、元のモデルに存在する他の変数 (20 個の変数) を省略しました。
少なくとも 1 時間作業した後、サマリー コマンドを実行します。
summary(reg1)
さらに1時間作業した後、エラーが発生しました:
Error in crossprod(t(X), beta) : non-conformable arguments
だから、多重共線性の問題があると思いました。そこで、相関行列で多重共線性をチェックします。
p1 <- with(df, data.frame(woman=woman, age=age, high=high, medium=medium, nord=nord, centre=centre))
round(cor(p1),3)
すべての変数を使用して行列を作成したとします (ここでは、簡単にするために省略しています)。関連する値が見つかりませんでした。また、分散インフレ係数もチェックします。
vif(p1)
そして私は得ました:
No variable from the 20 input variables has collinearity problem.
この時点で、共線性の問題は、両側回帰を実行するという事実によって決定できると思いますが、問題を管理する方法がわかりません。
前もって感謝します。