2

時系列モデルをテストするための良いアプローチは何でしょうか。時間領域t1、t2、...tNに時系列があるとします。たとえば、zt1、zt2、... ztNの入力と、x1、x2...xNの出力があります。

さて、それが古典的なデータマイニングの問題である場合、相互検証、リーブワンアウト、70-30などの既知のアプローチを使用できます。

しかし、時系列でモデルをテストする問題にどのように取り組む必要がありますか?最初のt1、t2、... t(Nk)入力でモデルを作成し、最後のk入力でテストする必要がありますか?しかし、kではなくpステップ先の予測を最大化したい場合はどうなりますか(p <k)。特定のケースに適用できる堅牢なソリューションを探しています。

4

2 に答える 2

3

のどちらかを選べるようです

  1. 最初の数年間のデータを使用してモデルを作成し、残りの年数をどの程度予測できるかを確認します。

  2. 入力条件の一部のサブセットについてすべての年のデータを使用してから、残りの入力条件を使用してどれだけうまく予測できるかを確認します。

于 2011-01-24T17:10:30.380 に答える
3

時系列フィッティングでは、モデルを開発するまでサンプル外データを使用しないように注意する必要があります。モデリングの主な問題は、オーバーフィットしやすいことです。

通常、サンプル内モデリングに 70%、サンプル外テスト/検証に 30% を使用します。そして、モデルを本番環境で使用すると、毎日収集するデータは真のサンプル外データ (見たことも使用したこともないデータ) になります。

十分なデータ ポイントがある場合は、ローリング ウィンドウ フィッティング アプローチを試すことをお勧めします。インサンプルのタイム ステップごとに、N タイム ステップを振り返ってモデルを適合させ、モデルのパラメーターが時間の経過とともにどのように変化するかを確認します。たとえば、モデルが Y = B0 + B1*X1 + B2*X2 の線形回帰であるとします。サンプルに対して N - window_size 時間の回帰を行います。このようにして、とりわけ、ベータが時間に関してどれほど敏感であるかを理解できます。

于 2011-01-24T19:45:08.087 に答える