ハードウェア障害などの非自発的な中断を処理するようにマイクロサービスを設計する必要がありますか? これらの中断は、AWS 管理の EKS クラスターで実行されているサービスで処理するのに十分な頻度ですか?
各ステップでデータを永続化するなどの方法で予期しない SIGKILL を処理するために、サービスの設計変更を検討する必要がありますか?それともオーバーエンジニアリングと見なされますか?
これらの不本意な混乱を処理するために提案する標準的な方法は、次の場合です
。a) 通常は 1 秒で応答する (サガ パターンに従う) 安らかなサービス。b) 1GB の大きなファイルを 1 時間で処理するサービス。