問題タブ [mlops]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
47 参照

google-cloud-platform - VertexAI パイプラインと Kuberflow コンポーネントを使用してバッチ予測を自動化する

以下のコードは、VertexAI で既にトレーニングされたモデルを読み込み、バッチ予測のパイプラインを実行します。ただし、どこから来たのかを把握できないというjsonデコーダーエラーが発生します。入力ファイルは jsonl 形式で、VertexAI ダッシュボードから手動でバッチ予測を実行すると正常に動作します。したがって、パイプラインに見えない何か問題があります。

ヘルプはありますか?

エラーが発生しました

また、モデルは正しくロードされます。バッチ予測ステージが失敗する

ここに画像の説明を入力

0 投票する
1 に答える
16 参照

amazon-web-services - ECS クラスターの CpuUtilization メトリックの解像度を 1 分マークを超えて向上させるにはどうすればよいですか?

ECS クラスター用の堅牢な自動スケーリング プロセスを作成しようとしていますが、CpuUtilization メトリックの解決に関する問題に直面しています。1 分の解像度で「詳細メトリック」をオンにしましたが、適切なスケーリング結果を得ることができません。推論に約 1.5 秒かかる ML モデルをデプロイしています。私はメモリのボトルネックに直面していないため、スケーリングに CpuUtilization を使用しています。

リクエストが積み重なり始めると、応答時間が 3 ~ 5 秒に簡単に短縮されるため、迅速なスケーリングが必要です。現在、「詳細メトリック」が有効になっています。3 つのデータポイントで 1 分間の解像度メトリックがチェックされるため、スケールアウト時間は開始までに約 3 ~ 5 分かかります。5 ~ 10 秒の解像度メトリックがある場合、30 秒以内に 6 つのデータ ポイントを確認し、スケールアウト ジョブをより迅速に開始できます。

このブログの Lambda、StepFunctions、EventBridge を使ってみました。ただし、CpuUtilization または MemoryUtilization を取得できず、タスク、サービス、およびコンテナーのカウントのみを取得できます。

ECS から直接 CPU とメモリのメトリックを取得する方法はありますか? cloudwatch.get_metric_statistics()を使用できることはわかっています。ただし、CloudWatch に報告されたデータポイントしか取得できません。だから、役に立たない。