問題タブ [keda]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - 理由もなく EKS Pod が終了する
誰かが私を助けてくれるのだろうか。
Kubernetes (K8s 1.21 プラットフォーム eks.4) は、実行中のポッドをエラーや理由なしで終了しています。イベントで私が見ることができる唯一のものは次のとおりです。
非アフィニティ ルールを設定したため、1 つのノードで実行できるポッドは 1 つだけです。したがって、ポッドが強制終了されるたびに、オートスケーラーは別のノードを起動します。
これらはクラスターオートスケーラーのログです
cluster-autoscaler と keda の aws-sqs トリガーを使用して EKS クラスターを実行しています。SPOT インスタンスを使用して自動スケーリング ノード グループをセットアップしました。
テスト目的で、time.sleep をループする単純な Python スクリプトを含むコンテナーで構成される ScaledJob を定義しました。ポッドは 30 分間実行する必要があります。しかし、そこまで到達することはありません。通常は 15 分後に終了します。
これはリソース (ダミー コードと大きなインスタンス) の問題でも、エビクションの問題 (ポッドがエビクションから安全であることはログから明らかです) でもないことはわかっていますが、これをトラブルシューティングする方法はもうわかりません。
どうもありがとう!!
編集:
オンデマンドおよび SPOT インスタンスと同じ動作。
編集2:
aws ノード終了ハンドラーを追加しました。他のイベントが表示されているようです。
スケーリング グループのアクティビティを確認すると、次のようになります。