2

それぞれに到着タイムスタンプを持つ一連のメッセージがあります。セットを分析し、メッセージの到着の周期性を判断したいと思います。(それがあれば、後続のメッセージが遅れたり欠落したりすると、ある程度確実に検出できます。)したがって、離散フーリエ変換は、セットから周波数を引き出すための論理的な選択のようです。

しかし、私が見た離散フーリエ変換のすべての説明は、一定の周波数でサンプリングされた有限の値のセットから始まります。私が持っているのは単なる値のセットです(単調に増加するタイムスタンプ値)。

時系列データに変換しますか?

小さな解像度 (たとえば 1 秒) を選択してから、最初のメッセージの時点から現在のリアルタイムまでの時系列を作成し、それぞれに対応する (0,1) の値を生成することを考えました。それらの時点。(ほとんどの場合ゼロで、各メッセージの到着時に 1 になります。)

詳細

多数のセットがあります:分析するメッセージのセットが多数あるため、この計算を何度も実行する必要があります。メッセージの各セットは、リアルタイムで最大 1 年にわたる 1,000 件程度のメッセージになる場合があります。したがって、(上で考えたように) 1 つのメッセージ セットを時系列に変換すると、これは、約 3,200 万 (1 年で秒) の時系列データ ポイントであり、ゼロ以外の値は約 1,000 のみです。

一部のメッセージ セットはより頻繁に発生します: 数日のスケールで最大 5,000 件のメッセージです。つまり、最大 400,000 個の時系列データ ポイントに似ていますが、ゼロ以外の値は最大 5,000 個しかありません。

これは正気ですか (到着時間を時系列に変換してから、単純な FFT 作業に進みます)? または、フーリエ変換を実際のデータ (メッセージ到着時間) に適用する別の方法はありますか?

4

1 に答える 1

2

メッセージを適切な期間の等間隔のビンにビン化し、これらのビンを時系列として扱い、FFT ベースの方法などを使用して、系列からスペクトルを生成することをお勧めします。結果のスペクトルは、特定のビン周波数付近のピークとして周期性を示すはずです。

于 2013-10-04T15:29:09.357 に答える