GCP AI Platform Unifiedのドキュメントには、次のように書かれています。
GPU を使用するように予測ノードを構成した場合でも、AI Platform は CPU 使用率に基づいてノードをスケーリングします。したがって、予測スループットによって GPU 使用率が高くなり、CPU 使用率が高くならない場合、ノードは期待どおりにスケーリングされない可能性があります。
GPU の使用状況に基づいてどのようにスケーリングしますか?
GCP AI Platform Unifiedのドキュメントには、次のように書かれています。
GPU を使用するように予測ノードを構成した場合でも、AI Platform は CPU 使用率に基づいてノードをスケーリングします。したがって、予測スループットによって GPU 使用率が高くなり、CPU 使用率が高くならない場合、ノードは期待どおりにスケーリングされない可能性があります。
GPU の使用状況に基づいてどのようにスケーリングしますか?