問題タブ [tensor2tensor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
google-cloud-ml - google ai-platform train api で cloud-tpu を使用すると失敗する
私は数日前まで tensor2tensor と cloud-tpu バックエンドで ai-platform train api を正常に使用していましたが、何かが変わったようで、先週から動作させることができません。
動作中/非動作中のログに見られる違いは、構成の「_master」と「_evaluation_master」です。
train api の最後の成功ログには、次のようなものが表示されます。
ただし、先週から見たログは次のとおりです。
次に、tensorflow はホスト名で tpu に接続しようとしますが、最終的に失敗し、プロセスが停止します。
両方の実験で同じコードが使用されます。
誰かが同様の問題に直面している場合は、これについて教えてください。ありがとう!