ML ワークロード ポッドの自動スケーリングに KEDA を使用しています。Pod は、Pod がまだキューのワークロードを処理している場合でも、キューがスケールダウンすると、キュー アイテムの数に基づいて自動スケーリングします。terminationGracePeriodSeconds を設定しましたが、ワークロードに対して高すぎるか低すぎます。
SIGTERM シグナルと事前停止について読みましたが、KEDA キュー ヘルム チャートを使用してこの問題を解決できるサンプルが見つかりませんでした