この質問は、同様の問題のクラス全体に関するものですが、具体的な例として質問します。
内容が変動するファイルシステムを備えたサーバーがあります。このファイルシステムの使用可能なスペースを監視して、いっぱいにならないようにする必要があります。議論のために、それがいっぱいになると、サーバーがダウンしたとしましょう。
それが何であるかは実際には問題ではありません。たとえば、「作業」のキューである可能性があります。
「通常の」操作中、使用可能なスペースは「通常の」制限内で変化しますが、次のような問題が発生する可能性があります。
- 作業を追加する他の(場合によっては外部の)コンポーネントが制御不能になる可能性があります
- 作業を削除する一部のコンポーネントが捕捉されますが、検出されないままです
プロセスの統計的特性は基本的に不明です。
私が探しているのは、利用可能なスペースの定期的な測定値を入力として受け取り(入力の代替提案を歓迎します)、出力として、物事が「異常」でファイルシステムが「」の場合にアラームを生成するアルゴリズムです。いっぱいになる可能性があります」。誤検知を回避することは明らかに重要ですが、誤検知を回避することとほぼ同じくらい重要であり、アラームを受信するシステム管理者の脳を麻痺させることを回避します。
根本的な問題により多くのストレージスペースを投入するなどの代替ソリューションがあることを感謝しますが、実際には1000回では不十分な場合があります。
保存された履歴測定値を考慮するアルゴリズムは問題ありませんが、履歴データの量を最小限に抑えるオンザフライアルゴリズムが推奨されます。
私はフランクの答えを受け入れました。そして今、彼の参考文献を深く研究するために画板に戻っています。
興味深いのは、順番ではなく、3つのケースがあると思います。
- 「ハロッズの販売が始まったばかり」のシナリオ:1秒の解像度では「ダイヤル外」であるが、リソース枯渇の本当の危険性を表していない活動のピーク。
- 「地球温暖化」シナリオ:(比較的)安定した成長を計画する必要があります。と
- 「Googleは私にインデックスの一方的なコピーを送っています」シナリオ:これは、私がそれを止めるために何かをしない限り、比較的短い順序で私のすべてのリソースを使い果たします。
これは、システム管理者の観点から、(私が思うに)最も興味深く、やりがいのある最後のものです。