問題タブ [tpu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - Estimator API を使用せずに TPU で python tensorflow コードを実行することは可能ですか?
私は、TPU と直接通信できる Python レベルの Tensorflow コードを書こうと何週間も費やしてきました。Estimator API なしで TPU で実行できるシステムをどのように実装できますか?
私が試したリソース:
- https://www.tensorflow.orgの Estimator API、TPU に関するすべてのドキュメント
私が試した方法:
TPUClusterResolver を初期化し、それを tf.Session() の引数として渡しましたが、session.run() を実行せずにハングしていました。
sess.run(tpu.initialize_system()) も試してみましたが、同様にスタックしました
そこにTPUEstimator APIを調べてみました
Estimator API の実装に関する問題:
- ニューラル ネットワークを含むポリシー勾配ベースの強化学習コードがあります。
- 実行中に 2 つの session.run() があります。1 つはエピソード内のすべてのステップで実行されます。もう1つはエピソードの終わりに実行されています
- tf.train.SessionRunHook は私のコードに適した実装ではありません
tensorflow - TPU で学習する keras に複数の「正しい」メトリックを使用できるようにするための回避策はありますか?
Google colaboratory で Keras を使用して小さなモデルを作成しました。また、TPU で学習を実行すると、間違ったメトリクスが表示されます。
もちろん、CPU/GPU で学習を実行すると、m1 および m2 メトリックは正しい数値を示します。(以下のコードを参照)
しかし、ランタイム タイプを TPU に変更した後、m1 と m2 は正しくなく、これらの値の平均のように見えます。
【CPU/GPUの結果】
【TPUの結果】
CPU/GPU の結果が正しいことは明らかです。なぜこれが起こったのですか?回避策はありますか?
- メトリクス ([m1] など) を 1 つだけ使用する場合、値は正しいです。
python - Google TPU で通常の Python コードを実行することはできますか?
だから私はGoogle TPUでかなり新しいです。私がすでに調査したところによると、TensorFlow で記述された機械学習モデルのトレーニング用に特別に最適化されています。現在、TPU が他のタイプの機能でどのように機能するかを確認しようとしています。これらの機能は機械学習とは関係ありません。Google Colab の TPU で実行できるようにコードを調整しようとしていますが、それが機能しているかどうか、またはこれが最善のアプローチであるかどうかはわかりません。これは、行列乗算アルゴリズムのコードです。O(n3)
私が恐れているのは、これが TPU で実行されていないことです。呼び出すsession.list_devices()
と、CPU がリストされていることがわかります。コードが実際には TPU ではなく CPU で実行されているのではないかと心配しています。これは、上記のコマンドの出力です。
今のところ、どのアクセラレータを使用するかについてのアドバイスは求めていません。TPU をテストして、コードが実行されていることを確認したいと考えています。助けてください!