2

私のデータ: 私の時間別データには、日次と週次の 2 つの季節パターンがあります。たとえば...私のデータセットの各日は、時間に基づいてほぼ同じ形をしています。ただし、土日など特定の日にはデータが増加し、1 時間ごとの形状もわずかに異なります。

(ここで発見したように、holt-winters を使用: https://gist.github.com/andrequeiroz/5888967 )

1 シーズンあたり 24 周期を使用してアルゴリズムを実行し、7 シーズン (1 週間) を予測すると、金曜日の曲線に基づいて土曜日の曲線を推定しているため、平日は過大に予測され、週末は過少に予測されることに気付きました。金曜日の曲線と土曜日(t-1)の曲線の組み合わせではありません。24 と 7 の両方のように、データに副次的な期間を含めるにはどうすればよいでしょうか? それらは私が使用すべき別のアルゴリズムですか?

4

1 に答える 1

3

さまざまな形状を説明する明白な方法の 1 つは、1 種類の期間のみを使用することですが、周期を 7*24 にすることで、1 週間全体を 1 つの形状として予測することになります。

予測値が線形トレンドにダミー変数の寄与を加えた線形回帰を試しましたか? 説明する最も簡単な例は、トレンドと毎日の貢献のみです。それからあなたは持っているでしょう

Y = X*t + c + A*D1 + B*D2 + ... F * D6 (+ ノイズ)

ここでは、線形回帰を使用して、X、c、および A...F の最適な値を見つけます。t は時間であり、0、1、2、3、... と無期限にカウントアップするため、X の近似値は傾向を示します。c は定数値なので、予測されたすべての Y を上下に移動します。D1 は火曜日に 1 に設定され、それ以外の場合は 0 に設定され、D2 は水曜日に 1 に設定され、それ以外の場合は 0 に設定されます。月曜日の項は適合しません。これは、c 項を区別できないためです。c に 1 を加算し、A..F のそれぞれから 1 を減算すると、予測は変更されません。

各日の 24 時間の形状を説明するために 23 の項を追加し、各平日の 24 時間と各週末の異なる 24 時間の形状を説明するために合計 46 の項を追加できることがわかります。日。

無料の R パッケージ ( http://www.r-project.org/ )など、これを処理する統計パッケージを探すのが最善です。少し学習曲線がありますが、この種の予測に使用するための書籍や記事を見つけることができるでしょう。

あなたが何をしようとも、私はあなたの過去のデータと照らし合わせて予測方法をチェックし続けます。人々は、実際に最も正確な予測方法が驚くほど単純であることが多いことに気付きました。

于 2014-09-11T05:23:37.540 に答える