3

私はフォーチュン 500 企業で働いており、高可用性アプリケーション (つまり、5 秒のページ間ナビゲーションで 99.5% 向上するアプリ) のパフォーマンスと可用性を正確に測定するのに苦労しています。この可用性の数値を決定するために、予定されたダウンタイムと予定外のダウンタイムの両方が考慮されます。ただし、最近CDNをミックスに追加したため、メトリックが少し複雑になりました. 現在、CDN はトラフィックの約 75% を処理し、残りを独自のサーバーに送信しています。

私たちは「真のユーザー エクスペリエンス」と呼ぶものを測定しようとします (つまり、テスト スクリプトは、アプリケーションを介してクリックする一般的なユーザーをエミュレートします)。これらの監視スクリプトは、ネットワークの外部に位置します。時間。

経営陣は、可用性を測定するために最悪のシナリオを採用することを決定しました。そのため、オリジン サーバーに問題があっても、CDN がコンテンツを問題なく提供している場合でも、可用性に影響が及びます。逆も同様です。私の考えでは、「ユーザー エクスペリエンス」が成功している限り、不必要に自分を罰するべきではありません。結局のところ、CDN はパフォーマンスと可用性を向上させるためにあるのです!

他のフォーチュン 500 企業がどのように利用可能数を計算しているかについて知っている人がいるかどうか疑問に思っています。たとえば、Apple.com を見てみると、ダウンしているようには見えない CDN を使用しているストアフロントが見られます (主要な製品の発表がない限り)。これらの指標で不必要に自分自身を傷つける必要があるとは思わないでください. 私たちこれらの数値に基づいてビジネス上の意思決定を行っています。

ただし、これらのメトリクスが経営陣に見えることを考えると、問題は非常に迅速に対処され、解決されると言えます (読んでください: 私たちは官僚主義をかなり迅速に切り捨てます)。外部要因 (CDN など) が数値に影響を与えているため、アプリケーションが稼働しているか停止しているかを示します。

考え?

(Sanoj の要請で、この質問を ServerFault に投稿しました...誰かこの質問を閉じてもらえますか ? -availability-app-that-is-using-a )

4

0 に答える 0