HPA のいくつかで奇妙な問題が発生しています。理由は不明ですが、最大レプリカ数までスケールアップする必要があると報告しています。既存の目標は 2%/80% ですが...現在 3 か月以上完全に機能しており、そのうちの 2 つのサービスはHPAはおかしくなり、1か月以上触れられていません。また、同じクラスターと名前空間内の他の HPA は完全に正常に動作しています。
HPA が計算しているものを確認する方法を見つけようとしています。どこかに書き込まれたログはありますか? そして、どこでそれらを見つけることができますか?
ありがとうございました
- アップデート -
これは、ほぼ同じシナリオで再び発生しました。一部の HPA は、実際の CPU 消費量がしきい値を大幅に下回っているにもかかわらず、再び最大までスケールアップしました。過去の使用率も目標のパーセンテージを超えていないことも確認できたので、なぜこれが起こっているのかを理解するのは本当に途方に暮れています.
私が本当に知りたいのは、どの CPU 値が HPA 計算機に送信されているかということですが、どこでそれらを見つけることができるかわかりません。誰か私がそれを見つけることができる場所を知っていますか?
ありがとうございました
-- 更新 2 -- ソース コードを見つけましたが、実際にはこの情報がログ データやイベントとして出力されていないように見え始めています。したがって、これをさらにトラブルシューティングするために、今本当に途方に暮れています。