15

私は時系列分析が初めてです。短い(1日)気温の時系列の傾向を見つけようとしており、さまざまな近似を試みました。また、サンプリング頻度は2分です。データは、さまざまなステーションに配置されました。そして、異なる傾向を比較して、それらが似ているかどうかを確認します。

これを行うには、次の 3 つの課題に直面しています。

Q1 - パターンを抽出するにはどうすればよいですか?

Q2 - 2 つの異なる場所に属する傾向を比較するため、どのように傾向を定量化できますか?

Q3 - 2 つの傾向が似ている、または似ていないと言えるのはいつですか?

4

1 に答える 1

11

Q1 -どのようにパターンを抽出できますか?

まず、両方のデータ セットに対して時系列分析を実行します。テストと比較を行うには、統計ライブラリが必要です。

Python を使用できる場合pandasは、良いオプションです。

Rでは、forecastパッケージは素晴らしいです。ets両方のデータセットで実行することから始めます。

Q2 - 2 つの異なる場所に属するトレンドを比較するため、トレンドを定量化するにはどうすればよいですか?

トレンドの定量化の背後にある考え方は、(線形の)トレンド ラインを探すことから始めることです。すべての統計パッケージがこれを支援します。たとえば、線形トレンドを想定している場合、データ ポイントからの二乗偏差を最小化する線。

トレンド推定に関するウィキペディアの記事は非常にアクセスしやすいものです。また、傾向は線形、指数関数的、または減衰する可能性があることに注意してください。これらを処理するために、さまざまなトレンド パラメータを試すことができます。

Q3 - 2 つの傾向が似ている、または似ていないと言えるのはいつですか?

  1. 両方のデータセットで ARIMA を実行します。(ここでの基本的な考え方は、(ARIMA モデルを構成する) 同じパラメーター セットが両方の一時時系列を記述できるかどうかを確認することです。(R) で実行するauto.arima()forecast、パラメーター p、d、q が選択されます。あなたのデータ、非常に便利です。

  2. もう 1 つの考えは、両方の系列の 2 サンプル t 検定を実行し、p 値の有意性を確認することです。(注意: 私は統計学者ではないので、時系列に対してこれを行うことに反対する理論があるかどうかはわかりません。)

  3. 調査中に、 Granger Testに出くわしました。基本的な考え方は、ある時系列が別の時系列の予測に役立つかどうかを確認することです。あなたのケースに非常に当てはまるようです。

したがって、これらは開始するためのほんの一部です。それが役立つことを願っています。

于 2012-12-12T20:58:29.223 に答える