問題タブ [stl-decomposition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 異常検出のための欠損値を含む時系列の STL 分解
いくつかの観測値が欠落している時系列の気候データで異常な値を検出しようとしています。ウェブを検索すると、利用可能な多くのアプローチが見つかりました。その中で、トレンドや季節的な要素を取り除いて残りを調べるという意味で、stl 分解は魅力的に思えます。STL: A Seasonal-Trend Decomposition Procedure Based on Loessを読むと、 stl は、変動性を割り当てる設定を柔軟に決定でき、外れ値の影響を受けず、欠損値があっても適用できるように見えます。ただし、4年間の観察とhttp://stat.ethz.ch/R-manual/R-patched/library/stats/html/stl.htmlに従ってすべてのパラメーターを定義して、Rに適用しようとすると、私はエラーが発生しました:
時系列には内部 NA が含まれます
いつna.action = na.omit
、そして
シリーズは周期的ではないか、周期が 2 つ未満です
いつna.action = na.exclude
。
周波数が正しく定義されていることを再確認しました。ブログで関連する質問を見たことがありますが、これを解決できる提案は見つかりませんでした。値が欠落しているシリーズで stl を適用することはできませんか? 私はアーティファクトを導入したくないので(結果として検出...)、それらを補間することに非常に消極的です。同じ理由で、代わりに ARIMA アプローチを使用することがどれほど賢明かはわかりません (また、欠損値が依然として問題になる場合)。
値が欠落しているシリーズで stl を適用する方法を知っている場合、または私の選択が方法論的に適切でないと思われる場合、またはより良い提案がある場合は共有してください。私はこの分野ではまったくの新人で、(一見...) 関連情報の山に圧倒されています。
r - Rを使用した時系列分解
を使用R
して、forecast package
いくつかの時系列モデルを作成しています。現在、このtbats
関数を使用して、複数の季節性データを処理しています。
近似モデルをプロットすると、時系列コンポーネントを含むプロットが得られます。私の質問は、slope
コンポーネントが正確に何を意味するのかということです。(ドキュメントで見つかりませんでした)。
コード:
ありがとう!
python - 不均一な間隔の時系列の季節分解、RまたはPythonで確立されたアルゴリズム?
R の stats パッケージには stl() がありますが、ts() によって作成された等間隔の時系列が必要です。動物園のオブジェクトを扱うことはできません。
奇妙なことに、STL メソッドは LOESS で欠損値を埋めることができると主張していますが、欠損値も処理できません。(履歴書でこの質問を参照してください。)
たとえば、営業日のデータがある場合、NA を週末に設定して stl() を呼び出して、カレンダー日にすることはできません。
また、Python statsmodel の作成者が stl() を Pandas TimeSeries で動作するように移行しようとしているのを目にしますが、まだそこにはないようです。
ありがとう
編集:高調波のフィッティングのような非常に単純なモデルを実行できることを知っていることを付け加えるだけですが、少なくともベンチマークを提供するために確立されたモデルが必要です。サブマンスリー データがあるため、X12 は適用されません。
r - R で dshw() を使用したネストされていない二重季節性
二重の季節性に対処するために dshw() を使用しようとしています。私の場合、1 週間 (7 日) と 1 年 (365 日) の季節性を持つ毎日のデータです。ただし、コードを実行すると次のエラーが発生します。
この問題を回避するためのベストプラクティスは何だと思いますか? データに対して stl を 2 回使用する必要がありますか (7 日と 365 日の頻度の場合)? それとも何らかの方法でデータを変更しますか?
ありがとう!
r - Rの多変量分解?
私は、非常に季節的な要素で毎日の売上データを分解しようとしています (ARIMA プロセスには長すぎる 365 日の季節性を作成します)。ただし、データに影響を与える定期的なマーケティング イベントなど、他の要因によって説明される時系列の特定の部分があります。ARIMA に外生変数を含めるのと同様の方法でR の関数を使用したいと考えてstl
いますが、外生変数をミックスに入れる場所がありませんでした。代わりに、別の回帰で外生変数を「残り」の部分に適用しましたが、上記の定期的なマーケティング イベントのために、 によって取り上げられた季節性stl
が誤っているのではないかと心配しています。
この問題を回避する方法について何か提案はありますか?
r - ts オブジェクトの二重季節サイクル
ts から季節性を取り除きたい。この特定の ts は日単位で、年単位と週単位の両方の季節サイクル (頻度 365 と 7) があります。
両方を削除するために、傾向と残りを抽出し、新しい ts の頻度を 7 に設定する前に、頻度を 365 に設定して ts で stl() を実行しようとしました。
これはうまく機能していないようで、それが私のアプローチなのか、それとも問題を引き起こしている ts に固有のものなのか疑問に思っています。誰かが私の方法論を批判し、おそらく別のアプローチを推奨できますか?
r - R の時系列オブジェクトに多くの問題がある
一部の予算データの時系列オブジェクトを処理するのに非常に苦労しています。
元のデータは、約 1800 の契約の 14,460 行の支払いで、各行には DD/MM/YYYY および Amount 機能があります。2000 年 1 月 1 日から 2014 年 12 月 31 日までの間に 5296 日ありますが、実際に支払いがあったのはそのうちの 3133 日だけです。したがって、日数は不規則で、複数の契約支払いが表示される日もあれば、支払いがゼロになる日もあります。
私が抱えている主な問題は、これらの時系列オブジェクトが、不規則な間隔で発生する毎日のデータが供給されるときに示す残忍な頑固さです。私は支払いを連続した日付ベクトルにマージしましたが、まだ同じ問題、つまり頻度、周期性、または order.by を抱えています。
fpp、予測、timeSeries、tseries、xts など、私がよく知っているほとんどの予測パッケージ (および SO でこれまでに尋ねられた質問のすべて) では、はるかに整然とした日付機能が必要ですorder.by
。他のそのような懸念。
私の懸念は、統計手法ではなく、R パッケージの妥当性です。たとえば、XTS、TS など、予測パッケージに必要な時系列オブジェクトを構築するいくつかの異なる方法を試しましたが、それらのすべてに頻度、周期性、または順序を求めている問題があります。 .
アップデート:
xts オブジェクトをビルドします
問題なく、そのオブジェクトをplot.xts()
編集できますが、試してみると
は言う