3

Excel で多項式回帰を実行すると、奇妙な問題が発生します。多くの人が以前に行ったように、Excel がグラフに多項式トレンド ラインを作成するときに使用する正しい係数を取得しようとしています。LINEST を使用してそれを行う方法を読み、2 次および 3 次回帰を実行すると、トレンド ラインの式に一致する答えを得ることができました... しかし、4 次または 5 次回帰を試みると、答えは何と大きく異なります。 Excel がトレンド ラインの数式を表示しています。

チャートと5次回帰での私の試みを含むデータは次のとおりです。Excelワークブックをクリックしてください

何が問題を引き起こしているのか、誰にもアイデアはありますか?

ありがとう!

-ジョン

4

2 に答える 2

0

過剰適合している可能性があります。実際、5次多項式を使用している場合は、おそらくそうだと思います。多項式が次数 3 よりも高い場合 (場合によっては 1 次よりも高いこともあります!)、「傾向線」が終点で宇宙空間に飛び出すリスクがあります。特定のレベルの複雑さを超えると、データを生成した基本的なメカニズムではなく、データ ポイントのランダムな変動にモデルを適合させます。

この問題を回避する 1 つの方法は、リッジ回帰のような正則化メカニズムを使用することです。Christopher Bishop の著書Pattern Recognition and Machine Learningには、このトピックに関する優れた議論があり、多項式回帰を正則化する方法の良い例が示されています。

ところで、私は統計分析に Excel を使用しません。これは、 Computational Statistics and Data Analysisジャーナルからの Excel の統計機能に関する記事です (これへのリンクは別の stackoverflow の投稿で初めて見ましたが、どこにあったかは覚えていません。元の投稿者に適切なクレジットを与えなかったことをお詫びします): http: //www.pages.drexel.edu/~bdm25/excel2007.pdf

于 2015-06-03T00:01:04.477 に答える