問題タブ [tensor2tensor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
94 参照

google-cloud-ml - google ai-platform train api で cloud-tpu を使用すると失敗する

私は数日前まで tensor2tensor と cloud-tpu バックエンドで ai-platform train api を正常に使用していましたが、何かが変わったようで、先週から動作させることができません。

動作中/非動作中のログに見られる違いは、構成の「_master」と「_evaluation_master」です。

train api の最後の成功ログには、次のようなものが表示されます。

ただし、先週から見たログは次のとおりです。

次に、tensorflow はホスト名で tpu に接続しようとしますが、最終的に失敗し、プロセスが停止します。

両方の実験で同じコードが使用されます。

誰かが同様の問題に直面している場合は、これについて教えてください。ありがとう!