問題タブ [keda]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
113 参照

amazon-web-services - 理由もなく EKS Pod が終了する

誰かが私を助けてくれるのだろうか。

Kubernetes (K8s 1.21 プラットフォーム eks.4) は、実行中のポッドをエラーや理由なしで終了しています。イベントで私が見ることができる唯一のものは次のとおりです。

非アフィニティ ルールを設定したため、1 つのノードで実行できるポッドは 1 つだけです。したがって、ポッドが強制終了されるたびに、オートスケーラーは別のノードを起動します。

これらはクラスターオートスケーラーのログです

cluster-autoscaler と keda の aws-sqs トリガーを使用して EKS クラスターを実行しています。SPOT インスタンスを使用して自動スケーリング ノード グループをセットアップしました。

テスト目的で、time.sleep をループする単純な Python スクリプトを含むコンテナーで構成される ScaledJob を定義しました。ポッドは 30 分間実行する必要があります。しかし、そこまで到達することはありません。通常は 15 分後に終了します。

これはリソース (ダミー コードと大きなインスタンス) の問題でも、エビクションの問題 (ポッドがエビクションから安全であることはログから明らかです) でもないことはわかっていますが、これをトラブルシューティングする方法はもうわかりません。

どうもありがとう!!

編集:

オンデマンドおよび SPOT インスタンスと同じ動作。

編集2:

aws ノード終了ハンドラーを追加しました。他のイベントが表示されているようです。

スケーリング グループのアクティビティを確認すると、次のようになります。