特定のエラー コード (404 や 502 など) の急激な上昇 (スパイク) をキャッチする進行中のアラートを実際に使用できます。スクリプトに関しては、本当にあなたの助けを借りることができました :-)
私の理解では、検索クエリは通常のトラフィックを「認識」または「感知」し (どのくらいの長さか、おそらく 1 時間、2 時間)、1 ~ 2 時間前と比較してエラー コードが急増したときに警告する必要があります。エラー コード スパイクのしきい値は、90 秒以上発生している間、総トラフィックの 5% 以上である必要があると思います。
以下は、私が今日使用している Splunk クエリです。上で説明したように調整していただき、ありがとうございます。
tag=NginxLogs host=www1 OR host=www2 |stats count by status|eventstats sum(count) as total|eval perc=round((count/total)*100,2)|where status="404" AND perc>5