HPC クラスターがあり、その状態を Icinga2 で監視したいと考えています。クラスター内の各ノードに対して多数のチェックを定義していますが、実際に望んでいるのは、特定のパーセンテージ以上のノードが異常である場合に通知を受け取ることです。
クラスターを表すダミーホストを定義し、Icinga ドメイン固有言語を使用して、興味のあることを実現できることに気付きました ( http://docs.icinga.org/icinga2/latest/doc/module/icinga2/ chapter/advance-topics?highlight-search=up_count#access-object-attributes-at-runtime )。しかし、これは洗練されていない厄介な解決策のように思えます。
ホストグループに対してこの種の「集約」または「メタチェック」を定義することは可能ですか?