-3

私は監視チームで働いており、ツールに対するクライアントの負荷を監視しています。時系列ごとにレイテンシを記録しました。

最初は、異常検出を高めるために静的なしきい値を維持しました。ただし、季節性が発生すると機能しません。現在、データに ML を適用することを計画しています。

私のデータは次のようになります。

ここに画像の説明を入力

volume_nfs_ops   timestamp           mount_point
---------------------------------------------------------
2103             6/28/2018 3:16      /slowfs/us01dwt2p311
12440            6/28/2018 6:03      /slowfs/us01dwt2p311
14501            6/28/2018 14:20     /slowfs/us01dwt2p311
12482            6/28/2018 14:45     /slowfs/us01dwt2p311
10420            6/28/2018 18:09     /slowfs/us01dwt2p311
7203             6/28/2018 18:34     /slowfs/us01dwt2p311
14104            6/28/2018 21:58     /slowfs/us01dwt2p311
6996             6/29/2018 7:35      /slowfs/us01dwt2p311
11282            6/29/2018 8:39      /slowfs/us01dwt2p311

Google で検索すると、ARIMA が時系列に最適なモデルであることがわかりました。私は数学に向いており、それぞれの ARIMA が私のデータセットに適しているかどうかを判断できます。

私の質問は、Python で実装するのに最適なアルゴリズムはどれですか? 異常を見つけるためにどの要因を考慮する必要がありますか?

4

1 に答える 1