1
  behavior:
    scaleUp:
      stabilizationWindowSeconds: 0
      policies:
      - type: Percent
        value: 100
        periodSeconds: 60
      selectPolicy: Max

上記の動作を hpa に使用します。平均 CPU が目標を上回っている場合、hpa は 60 秒ごとに Pod の数を 2 倍にすることを期待しています。ただし、GKE ログから、実際には少しずつ増加していることがわかります。誰かがこれの背後にあるロジックを知っていますか?

「過去 60 秒間に作成されたインスタンスの 100% 以下 (毎回の使用状況/リクエストに基づいてワークロードを拡大する)」という意味ですか?

また

「CPU使用率がターゲットCPUよりも高い場合、100%アップスケールします」?

環境: プラットフォーム: gke バージョン。1.18.17-gke.1901

4

1 に答える 1

0

スタック オーバーフローへようこそ。

構成を使用して HPA を実装しようとしましたが、60 秒ごとに 2 倍になります。HPA が定常状態に達するまで、現在実行中のレプリカの最大 100% が 60 秒ごとに追加されます。

サンプルconfig.yaml:

behavior:
  scaleUp:
   stabilizationWindowSeconds: 0
   policies:
   - type: Percent
     value: 100
     periodSeconds: 60
   selectPolicy: Max

そのため、HPA に影響を与える他の制限の問題がある可能性があります。たとえば、HPA には、スケールアップする/できる量に追加の制限があります。

于 2021-06-29T15:14:42.377 に答える