問題タブ [gcp-ai-platform-training]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-platform - Google AI Platform のトレーニング - ジョブが完了するまで待ちます
多くの並列プロセスを含む AI Platform パイプラインを構築しました。各プロセスは、次のように AI プラットフォームでトレーニング ジョブを起動します。
次に、ジョブが終了して次のステップに進むまで待機する必要があります。--stream-logs
これを行うために、上記のコマンドにパラメーターを追加しようとしました。このようにして、ジョブが完了するまですべてのログをストリーミングします。
問題は、非常に多くの並列プロセスがあるため、ログを取得するためのリクエストが不足していることです。
ただし、実際にログをストリーミングする必要はありません。トレーニング ジョブが完了するまでプロセスに「待機」するように指示する方法が必要なだけです。これを行うためのよりスマートで簡単な方法はありますか?
python - Google AI プラットフォームが Cloud Storage に書き込めない
Google AI Platform でtensorflow-cloudジョブを実行すると、ジョブのエントリポイントは次のようになります。
ジョブは正常に完了し、ログに「hello world」と出力されます。
バケットとジョブは両方とも同じリージョンにあります。
しかし、Cloud Storage でファイルが見つかりません。そこにはありません。他のいくつかのテストを実行しtf.io.gfile.listdir
、新しいファイルを書き込んでtf.io.gfile.listdir
、前後を印刷しました。ファイルが追加されたようですが、クラウドストレージを開くと、そこに見つかりません。ストレージからファイルを読み取ることもできました。
パーミッション エラーは発生しません。公式ドキュメントにあるように、AI プラットフォームには Cloud Storage に対する読み取り/書き込みのパーミッションが既にあります。
これが私のmain.py
ファイルです:
これは、問題を再現できる最小限のバージョンです。