かなりオープンな質問で申し訳ありませんが、非常に価値のある議論の領域だと思います。
最近のAWS の停止とそれに続く膨大な数のホラー ストーリーに続いて、私は Netflix が適用した Chaos Monkey の「テクニック」に本当に感銘を受けました (ほぼ無傷で生き残った数少ないものの 1 つです。
この概念を知らない人のために説明すると、これは基本的に、回復力を継続的にテストする方法として、インフラストラクチャを巡回し、途中で混乱を引き起こす小さなボットです。
Jeff Atwood の Chaos Monkey の記事を除けば、これが他の場所で採用されていることについてはほとんど見つけることができませんでした。
優れたテスト駆動型開発が堅固な基盤であることは理解していますが、これは、最新の状態を維持したい企業/組織の武器庫への素晴らしい追加になると思います。
- 他の誰かが以前にこのトピックにアプローチしたことがありますか?
- 接続性とセキュリティの脆弱性以外に、そのようなコードがヒットする特定の領域はありますか?
- このアプローチに関する他の考え/感情はありますか?