0

先週 CloudWatch でいくつかのアラームを実装したところ、毎日 6 時 30 分から 6 時 45 分 (UTC 時間) の間に EC2 の小さなインスタンスで奇妙な動作に気付きました。

AutoScallingGroup の CPU 使用率が 3 分間 (平均サンプル) で 50% を超えた場合に警告するアラームを 1 つ実装し、同じ AutoScallingGroup が正常に戻ったときに警告する別のアラームを実装しました。 (平均サンプルも)。それを 2 回行いました。1 回はゾーン A 用で、もう 1 回はゾーン B 用です。

問題ないように見えますが、6 時 30 分から 6 時 45 分の間に何かが起こっており、2 分から 5 分間、ある程度の処理が必要です。CPU が上昇し、「使用頻度の高いアラーム」がトリガーされることがありますが、常に「正常に戻ったアラーム」がトリガーされます。私たちのシステムは現在開発の初期段階にあるため、ユーザーはアクセスできず、プロセス/バックアップなどもスケジュールされていません。Apache+PHP をほとんどインストールして構成していないので、ホスト マシンに関連するものに過ぎないと思います。

「正常に戻る」アラームでサンプル時間または % を増やす以外に、何が起こっているのか、どのように解決できますか? Amazonフォーラムの人々は、機会があればサービスチームが見てみると言いましたが、ほぼ1週間戻ってきませんでした.

4

0 に答える 0