Q1 -どのようにパターンを抽出できますか?
まず、両方のデータ セットに対して時系列分析を実行します。テストと比較を行うには、統計ライブラリが必要です。
Python を使用できる場合pandas
は、良いオプションです。
Rでは、forecast
パッケージは素晴らしいです。ets
両方のデータセットで実行することから始めます。
Q2 - 2 つの異なる場所に属するトレンドを比較するため、トレンドを定量化するにはどうすればよいですか?
トレンドの定量化の背後にある考え方は、(線形の)トレンド ラインを探すことから始めることです。すべての統計パッケージがこれを支援します。たとえば、線形トレンドを想定している場合、データ ポイントからの二乗偏差を最小化する線。
トレンド推定に関するウィキペディアの記事は非常にアクセスしやすいものです。また、傾向は線形、指数関数的、または減衰する可能性があることに注意してください。これらを処理するために、さまざまなトレンド パラメータを試すことができます。
Q3 - 2 つの傾向が似ている、または似ていないと言えるのはいつですか?
両方のデータセットで ARIMA を実行します。(ここでの基本的な考え方は、(ARIMA モデルを構成する) 同じパラメーター セットが両方の一時時系列を記述できるかどうかを確認することです。(R) で実行するauto.arima()
とforecast
、パラメーター p、d、q が選択されます。あなたのデータ、非常に便利です。
もう 1 つの考えは、両方の系列の 2 サンプル t 検定を実行し、p 値の有意性を確認することです。(注意: 私は統計学者ではないので、時系列に対してこれを行うことに反対する理論があるかどうかはわかりません。)
調査中に、 Granger Testに出くわしました。基本的な考え方は、ある時系列が別の時系列の予測に役立つかどうかを確認することです。あなたのケースに非常に当てはまるようです。
したがって、これらは開始するためのほんの一部です。それが役立つことを願っています。