優先度の低いジョブ、特にこの場合は Tensorflow を使用した ML トレーニングのために、kubernetes クラスターの予備の CPU 容量を使用したいと考えています。 OS プロセスの優先度が高くなります。現在、CPU 使用率が 60% を超えた場合にノードを追加するようにオートスケーラーを構成しています。これは、常に CPU の 40% が使用されていないことを意味します。
質問: (1) これは K8s で可能ですか? いくつかの実験の後、Podの優先度はまったく同じではないようです。優先度の低いデプロイが、優先度の高いデプロイに CPU をすぐに返さないためです。(2) 不可能な場合、意図的にオーバープロビジョニングされた CPU 容量を利用し、すぐに優先順位の高いサービスに譲る、一般的に使用される別の戦略はありますか?