製品の売上の推移を約 1 秒で説明する R データフレームがあります。四半期ベースの 2000 ショップ、5 つの列 (つまり、5 つの期間)。Rで解析する方法を知りたいです。
私はすでにいくつかの基本的な分析を試みました。つまり、第 1 期間、第 2 期間などの平均売上を決定し、次に各期間の平均を決定し、各ショップの進化を相対的に比較します。この一般的な進化。例えば、1期50000枚、5期35000枚の売上があるので、各店の5期の通常の売上は、35/55=0.63×1期の金額になると思います。期間の販売: X 店が第 1 期間に 100 個の商品を販売した場合、通常、第 5 期間に 63 個の商品を販売する必要があると想定します。
明らかに、これは簡単に実行できる方法ですが、統計的に適切ではありません。
R 2 乗を最小化するトレンド カーブを決定できる方法が必要です。私の目的は、一般的な傾向を中和することによってショップの売上を分析できるようにすることです。統計的に正しいアプローチを使用して、パフォーマンスの低いショップとパフォーマンスの高いショップを正確に知りたい.
私のデータフレームはこのように構成されています:
shopID | sum | qt1 | qt2 | qt3 | qt4 | qt5
000001 | 150 | 45 | 15 | 40 | 25 | 25
000002 | 100 | 20 | 20 | 20 | 20 | 20
000003 | 500 | 200 | 0 | 100 | 100 | 100
... (2200 rows)
次の機能を使用して、timeseries をリストに入れようとしましたが、成功しました。
reversesales=t(data.frame(sales$qt1,sales$qt2,sales$qt3,sales$qt4,sales$qt5))
# I reverse rows and columns of the frame in order that the time periods be the rows
timeser<-ts(reversesales,start=1,end=5, deltat=1/4)
# deltat=1/4 because it is a quarterly basis, 1 and 5 because I have 5 quarters
それでも、この変数では何もできません。2200行あるため、(「プロット」関数を使用して)プロットを実行できません(したがって、Rは2200個の連続したプロットを作成したいと考えています。明らかにこれは私が望んでいるものではありません)。
また、店舗ごとの各期間の売上の理論トレンドと理論値の求め方がわからない…
ご協力ありがとうございました!(そしてメリークリスマス)