でキャプチャされたネットワーク トラフィックを処理する必要があることに気付きましたtcpdump
。トラフィックを読み取るのは難しくありませんが、トラフィックのどこに「スパイク」があるかを見つけるのは少し難しいです。私は主に TCP SYN パケットに関心があり、特定の宛先ポートのトラフィックが急激に増加する日を見つけたいと考えています。処理するデータがかなりあります (約 1 年)。
私がこれまでに試したことは、指数移動平均を使用することです。これは、いくつかの興味深い測定値を取得するのに十分でしたが、私が見たものを外部データ ソースと比較すると、物事にフラグを立てるには少し積極的すぎるようです。異常な。
私が読んだいくつかの論文にはリソースの使用状況をそのようにモデル化することに成功し、成功を収めました。
それで、誰かがこの種のことを読んで読むための良い方法や場所を知っていますか.
私が使用している移動平均は、おおよそ次のようになります。
avg = avg+0.96*(new-avg)
avg
EMAでありnew
、新しい尺度であること。どのしきい値を使用するか実験してきましたが、「新しい値を重み付けする前に、平均よりも所定の係数を高くする必要がある」と「少なくとも 3 倍高くする必要がある」を組み合わせて、悪い結果を最小限に抑えることがわかりました。