問題タブ [self-healing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - 複数の AWS アカウントを管理する
複数の aws アカウントを追跡できるシステムを知りたいです。各アカウントには約 200 以上のサーバーが含まれており、約 130 以上のアカウントがあります。
マシンの障害、サービスの障害などを追跡する方法を知りたいです。
また、基盤となるハードウェアが故障したり、その場でマシンが終了した場合に、マシンを自動的に起動できる方法も知りたいです。
シェフ/テラフォームの自動化、ヒーリング スクリプトなどを含むすべてのソリューションを受け入れ
ています
。
kubernetes - docker-compose は自己回復オーケストレーターですか?
kubernetesでは、ポッドが何らかの理由でダウンした場合、アドミッション コントローラーがポッドを再起動します。
私たちはこのメカニズムをセルフヒーリングと呼んでいます。
私はdocker-composeを使ったことはありませんが、同じでしょうか?
kubernetes - 非自発的な中断 / サガパターンに従ったマイクロサービスでの SIGKILL 処理
ハードウェア障害などの非自発的な中断を処理するようにマイクロサービスを設計する必要がありますか? これらの中断は、AWS 管理の EKS クラスターで実行されているサービスで処理するのに十分な頻度ですか?
各ステップでデータを永続化するなどの方法で予期しない SIGKILL を処理するために、サービスの設計変更を検討する必要がありますか?それともオーバーエンジニアリングと見なされますか?
これらの不本意な混乱を処理するために提案する標準的な方法は、次の場合です
。a) 通常は 1 秒で応答する (サガ パターンに従う) 安らかなサービス。b) 1GB の大きなファイルを 1 時間で処理するサービス。