Riemann と Riemann-health を使用してサーバーを監視しています。ただし、CPU が非常に短い時間ピークに達したため、かなり多くの CPU クリティカル警告が表示されます。これは、知る必要さえないと思います。私の理解では、一定の CPU 使用率が高いと平均負荷が増加し、これも報告され、より便利に聞こえます。
CPU のレポートを無効にしたくありません。すべてのレベルを問題ないと見なす必要があります。可能であれば、Riemann サーバー上のイベントを変更したいので、すべてのサーバーを変更する必要はありません。
ここでリーマン設定: https://gist.github.com/iGEL/e352764a8c559440c851