週間データの売上を予測しようとしています。データは、104 週間の週番号、売上、平均価格/単位、休日 (その週に休日が含まれるかどうか)、およびプロモーション (プロモーションが行われる場合) の変数で構成されます。したがって、基本的にデータセットの最後の 6 つの obs は次のようになります。
Week Sales Avg.price.unit Holiday Promotion
101 8,970 50 0 1
102 17,000 50 1 1
103 23,000 80 1 0
104 28,000 180 1 0
105 176 1 0
106 75 0 1
ここで、105 週目と 106 週目を予測したいと思います。そこで、ts 関数を使用して単変量時系列 x を作成し、次のコマンドを発行して auto.arima 関数を実行しました。
x<-ts(sales$Sales, frequency=7)
> fit<-auto.arima(x,xreg=external, test=c("kpss","adf","pp"),seasonal.test=c("ocsb","ch"),allowdrift=TRUE)
>fit
ARIMA(1,1,1)
**Coefficients:
ar1 ma1 Avg.price.unit Holiday Promotion
-0.1497 -0.9180 0.0363 -10.4181 -4.8971
s.e. 0.1012 0.0338 0.0646 5.1999 5.5148
sigma^2 estimated as 479.3: log likelihood=-465.09
AIC=942.17 AICc=943.05 BIC=957.98**
ここで、過去 2 週間 (105 週目と 106 週目) の値を予測したい場合、105 週目と 106 週目のリグレッサーの外部値を指定します。
forecast(fit, xreg=ext)
where ext consists of future values of regressors for last 2 weeks.
The output comes as:
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
15.85714 44.13430 16.07853 72.19008 1.226693 87.04191
16.00000 45.50166 17.38155 73.62177 2.495667 88.50765
以前の値 (トレーニング) 値の販売値は一般に数千の範囲にあるため、販売の予測値が非常に少ないため、出力は正しくないように見えます。
それが正しくない/予期しない理由を誰かが教えてくれれば、それは素晴らしいことです.