5

問題の制約

  • データセットのサイズはわかっていますが、データ自体はわかっていません。
  • データ セットは、一度に 1 データ ポイントずつ増加します。
  • トレンド ラインは、一度に 1 つのデータ ポイントでグラフ化されます (スプライン/ベジエ曲線を使用)。

グラフ

以下のコラージュは、かなり正確な傾向線を持つデータ セットを示しています。

ここに画像の説明を入力

グラフは次のとおりです。

  • 左上。時間ごと、最大 24 のデータ ポイント。
  • 右上。1 年間の日別、最大 365 のデータ ポイント。
  • 左下。約 52 のデータ ポイントを使用して、1 年間の週ごと。
  • 右下。1 年間の月単位で、最大 12 のデータ ポイントがあります。

ユーザー入力

ユーザーは以下を選択できます。

  • 時系列のタイプ (毎時、毎日、毎月、四半期、毎年); と
  • 時系列の開始日と終了日。

たとえば、ユーザーは 6 月の 30 日間の日次レポートを選択できます。

傾向の重み

ウィンドウ サイズ (つまり、トレンド ラインを計算するときに平均化するデータ ポイントの数) を計算するには、次の式を使用します。

data points / trend weight

Whereはdata pointsユーザー入力から導出され、6.4です。トレンド ウェイト6.4は適切なフィット感を生み出しますが、かなり恣意的であり、さまざまなユーザー入力には適切ではない可能性があります。trend weight

質問

この問題の制約を考えると、どのtrend weightように計算する必要がありますか?

4

3 に答える 3

1

グラフの外観に基づいて、12 ポイントのグラフにはポイントが多すぎると言えます (これは与えられたポイントの単なるスプラインです...これは視覚的には楽しいですが、実際には、トレンド)、365 ポイント グラフのポイントが少なすぎます。おそらく、次のような少し指数関数的なことを試してみてください。

(Data points)^1.2/14.1

これはあなたがすでに持っているものよりもさらに恣意的であることは理解していますが、恣意的は世界で最悪のことではありません.

(52 ポイントのグラフを固定したままにしようとして 14.1 を取得しました(52^(1.2)/52)*6.4=14.1。これは .

ダン

于 2010-03-24T15:55:57.363 に答える
0

これら 4 つのグラフでは傾向線が正確に見えるかもしれませんが、実際にはかなりずれています。(これは、左下の開始点と右上の開始点で最もよく見られます。トレンドラインを見つけるときは、ポイントの半分以上を使用する必要があると思います (ただし、実際にはもっと多くのポイントを使用する必要があります)。トレンド ウェイトは最大で 2 にすることをお勧めします. ただし、実際には 1 ~ 1.5 の範囲に近づける必要があります. これは任意であるため、ユーザーに「トレンド ラインの精度」スライダーを提供することをお勧めします.彼らは、最も正確な設定が 1 の傾向の重みを使用し、最も正確でない設定が の重みを使用する場所を使用できます#of data points +1.これは 0 ポイントを使用します (いつも四捨五入を面白いと思います) そして、統計ソフトウェアは異なるかもしれませんが、まっすぐな水平線を生成します。

于 2010-03-24T01:28:16.897 に答える