私は 5 つの変数の時系列の観察結果を持っていy, x_1, x_2, x_3, x_4
ます。タスクは、どのx
es が の変化の原因であるかを見つけることy
です。ここでの問題は、それらすべてが相互相関が強く、共線性を示すことです。x_1, x_2, x_3, x_4
ペアワイズまたはその他の方法でそれらに共通する隠されたコンポーネントを内部に持っていません-それらは自然に相関しています。
予想どおり、線形回帰は、変数の 1 つを削除した後に係数が大幅に変化する不合理な結果をもたらします。これは、共線性の高いデータの通常の図です。
wikiでアドバイスされているように、多重共線性のいくつかの救済策は、リッジ回帰と主成分回帰を使用しています。ただし、lm.ridge
メソッドを使用すると、 とまったく同じ係数が得られlm
ます。
そのような場合に PCR は役立ちますか?もしそうなら、R で係数と p 値を取得する簡単な方法は何ですか? 関数の要約表のようなものlm
。