問題タブ [google-cloud-vertex-ai]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - Vertex AI トレーニング ジョブが失敗した場合 (3 回試行後)、ログ ルーター シンクを作成する方法を教えてください。
Vertex AI custom training jobで(カスタム コンテナーを使用した機械学習のトレーニング) を実行していGCPます。Pub/SubSlack などのチャットにメッセージを投稿できるように、ジョブが失敗したときにメッセージを作成したいと考えています。ログファイル (Cloud Logging)次のようになっています。
次のクエリを使用してログ ルーター シンクを作成しています。
私が直面している問題は、Vertex AI がジョブを失敗として宣言する前にジョブを 3 回再試行することですが、ログファイルのメッセージは同じです。以下に 3 つの例を示しますが、3 回失敗した最後の例だけが最後に実際に失敗しました。

たとえば、ログファイルにはカウントIDがありません。これを解決する方法はありますか?すべてのプロジェクトでそれを行う必要がある場合、失敗ごとの数を追跡するために BigQuery テーブルを作成するのresource.labels.job_idはやり過ぎのようです。resource.labels.job_idLogs Router Sink 内でgroup by および count を実行する方法はありますか?
google-cloud-platform - AutoML 表形式モデルを再トレーニングできますか
Google クラウドで AutoML を使用して、表形式のデータでモデルをトレーニングしました。結果のモデルは、25 個のモデルのアンサンブルです。さて、増分データを取得すると、Google はゼロからでも再トレーニングを許可しますが、この特定のアンサンブルは問題ありませんか? または、モデル アーキテクチャがそれほど急速に変化する可能性は非常に低く、したがって計算の点で非常に無駄になるため、毎回まったく新しいモデル アーキテクチャの検索を行う必要があります。このような類似の質問がいくつかあることは知っていますが、まったく同じものはなく、私の質問に直接当てはまる回答はまだ見たことがありません。
google-cloud-ml - Vertex AI Auto ML モデルでのカスタム IOU しきい値の設定
モデルのエンドポイントを呼び出すときに IOU しきい値を手動で設定する最良の方法は何ですか?
サンプル API で Python リクエストを作成すると、信頼度と予測の最大数を設定できることは明らかですが、IoU しきい値を設定するにはどうすればよいですか?
Python リクエストで設定されたパラメーターを変更するメトリックとしての IOU しきい値。
Google が提供するサンプル リクエスト。 https://github.com/googleapis/python-aiplatform/blob/master/samples/snippets/predict_image_object_detection_sample.py