「大規模なサーバー ファーム」は、強制されない限りシャットダウンしないように設計されていることに注意してください。つまり、可能性はあるが、はるかに遠い出来事であり、それが起こったとき、あなたは本当に急いでいる. ラックのシャットダウンや電力線での作業など、他のすべてのユースケースは、可能な限り事前に計画されます。
物事が本当にうまくいかないとき、あなたは実際に急いでいるでしょう。
たとえば、発電機が燃料を使い果たした場合 (通常、発電機は少なくとも 1 日分の予備を保持し、時間内に再供給されるように契約を結んでいるため、ここでは大きな災害について話している)、または同様のイベントが発生した場合は、それがわかります。物事をシャットダウンするのに何時間もかかります。または、HVAC システムが完全に故障した場合、温度が上昇しすぎる前にすべてをシャットダウンする時間がほんの数分しかありません。
私はここでは専門家ではなく、バリケードの向こう側 (データセンターの顧客) にいますが、彼らは、制御するすべてのシステムのシャットダウンを命令するシステムを備えていると思います。顧客のシステムを制御できず、正しくシャットダウンできません。
すべてのシステムがオンラインに戻り、全能力 (UPS、発電機、HVAC など) の準備が整うと、ファームは最終的に一度に 1 つのゾーン、一度に 1 つのラックに再び電源が投入されます。彼らがシステムを完全に制御できるようになると (つまり、顧客のシステムではなくプライベート ファーム)、通常はすべての回路に AC を徐々に導入し、サーバーの電源を自動的にオンにします (そうするように構成されている場合、多くのサーバーには設定さえあります)。 「最大 X 分のランダムな時間の後に電源を入れる」など)、または IPMI や同様のシステムなどの完全自動管理を介して電源を入れるように命令されます。