1

単純な線形回帰を使用して、住宅価格を予測する既存のモデルがあります。入力として日付があり、出力は価格です。

全体的な結果を改善したかったので、もう 1 つの機能を追加しました。新しい機能は、推定されたプロパティからの距離です。

問題は、多変量/多変量回帰のパフォーマンスが単純回帰よりも少し悪いことです。(すべてのデータは正規化されています)

なぜこれが起こっているのか、どうすればこれにアプローチできるのか、いくつかのアイデアがありますか?

4

1 に答える 1

1

考えられる理由は多数ありますが、いくつか挙げると次のようになります。

  • 新しい機能が予測しようとしているものとほとんど相関していない場合-システムにノイズを効率的に注入しているため、パフォーマンスの向上は期待できません
  • データポイントが非常に少ない場合、より多くの機能がより困難な問題につながる可能性があります
  • 線形モデルを使用しているため、新しい機能が非常に優れた予測子であっても、その関係は従属変数に対して線形ではありません-モデルも失敗します
  • 線形回帰自体は非常に素朴なモデルであり、リッジ/なげなわ回帰でさえ結果を完全に変える可能性があります(特になげなわは、悪い機能をより適切に処理するため)
于 2016-11-05T20:55:18.937 に答える