4

異なる日付範囲 (主に 2007 年から 2009 年) と頻度 (毎週、毎月、毎年など) の複数の時系列に対して算術演算 (+-*/) を実行するプログラムを作成する必要があります。

私が思いついた:

  • 周波数が最も高いシリーズを見つけます。次に、他のシリーズにゼロを入力して、同じ数の要素を持つようにします。その後、操作を実行します。

最も意味のある方法でデータを提示するにはどうすればよいですか?

あらゆる可能性を考えようとする

4

3 に答える 3

2

この時系列でゼロが意味のある値になる場合 (摂氏温度など)、すべてのギャップをゼロで埋めるのは得策ではない可能性があります (つまり、後で実際の値とスタブ値を区別できなくなります)。時系列を補間したい場合があります。このための基本的なデータ構造は、配列/二重連結リストにすることができます。

于 2009-12-29T07:56:38.943 に答える
1

私はこの問題をかなり広範囲に研究しました。内挿法の危険性は、さまざまな測定値、特にボラティリティにバイアスをかけ、疑似相関を導入することです。フーリエ補間はこれをある程度軽減することがわかりましたが、より良いアプローチは逆の方法です。頻度の低い系列の周期性と一致するように頻度の高い観測値を集計してから、これらを比較します。

于 2010-08-23T15:00:28.397 に答える
1

いくつかのアプローチを取ることができます:

  • 最も細かい時系列データ (たとえば、秒) を使用し、必要に応じてデータを補間/埋める
  • 最も粗い粒度 (年など) を使用し、必要に応じてデータを要約する
  • 両極端の間の中間のステップ

次の理由から、常にデータを把握しておく必要があります。

  • 補間の場合、最適なアルゴリズムを選択する必要があります (線形または二次補間、スプライン、指数など)。
  • 要約する場合は、適切な集計関数 (合計、最大、平均など) を選択する必要があります。

すべての時系列で同じ時間スケールを取得したら、算術的な魔法を実行できますが、補間によって余分な情報が生成され、要約によって利用可能な情報が削除されることに注意してください。

于 2009-12-29T08:11:16.857 に答える