問題タブ [sre]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - 「正帰還サイクル過負荷問題」を回避するには?
信頼性の高いシステムを設計しているときに、失敗した場合に (フィードバック メカニズムを使用して) 再試行を追加することで、システムの信頼性を高めようとすることがあります。また、すでに過負荷になっているシステムにさらに負荷を追加する可能性があるため、過負荷の可能性が生じます。過負荷状態を考慮して、どのようにインテリジェントな再試行を行うことができますか?
google-cloud-platform - GCP UI のエラー バジェットは 100% を超えるはずですか?
GCP で SLO を使い始めたばかりで、最初の SLI は機能しているようですが、「エラー バジェット」フィールドは 100% をはるかに超えています。私がオンラインで見たすべての例は 100% に収まっていますが、私のものは 700.00% 以上の間で変動しているように見えます。他の誰かがこれを経験しましたか?
私の SLI は Terraform を介して「request_based_api」として構成されており、カスタム ログの textPayload に基づいてログ エントリを報告するカスタム ログ メトリックである「good_service_filter」と「totaL_service_filter」を提供する「good_total_ratio」クエリを使用しています。 . 私のサービスは、最初のリクエストを表すログ エントリを作成する関数として開始され (したがって、total_service_filter によって取得されます)、サービスは Cloud Build プロセスとして終了し、正常な完了を表す同じログにログ エントリを書き込みます (したがって、good_service_filter によって取得されます)。
私が言ったように、それは機能しているように見えますが、エラーバジェットが非常に高いため、よくわかりません. 100% 以外のものとして示されている例を見つけることができなかったので、何らかの形でそれを台無しにしたのではないかと疑問に思っています。