問題タブ [google-ai-platform]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
95 参照

pytorch - Google AI Platform で PyTorch 予測を提供するための推奨される方法

Google のドキュメントを読むと、PyTorch モデルから予測を提供する 2 つの異なる方法があるようです。

  1. カスタム予測ルーチンの使用
  2. カスタム コンテナの作成と使用torchserve

このようなオンライン ブログを読むと、オプション 1 の方が人気があるように見えますが、ドキュメントでは明示的に PyTorch について言及されているため、オプション 2 を使用しないのは奇妙に思えます。

あるオプションを別のオプションよりも選択する理由を誰かが提供できますか?

0 投票する
1 に答える
1187 参照

docker - カスタム コンテナを使用する Google AI プラットフォームで動的ライブラリ libcuda.so.1 エラーを読み込めませんでした

カスタム コンテナを使用して Google AI Platform でトレーニング ジョブを開始しようとしています。トレーニングに GPU を使用したいので、コンテナーに使用した基本イメージは次のとおりです。

このイメージ (およびその上にインストールされた tensorflow 2.4.1) を使用すると、AI Platform で GPU を使用できると思いましたが、そうではないようです。トレーニングが開始されると、ログに次のように表示されます。

これは、Google AI Platform で GPU を使用するイメージを構築する良い方法ですか? または、代わりに tensorflow イメージに依存して、必要なすべてのドライバーを手動でインストールして GPU を活用する必要がありますか?

編集: ここ ( https://cloud.google.com/ai-platform/training/docs/containers-overview ) を読みました:

また、GPU を使用したトレーニング用の Dockerfile の例も示しいます。だから私がしたことは大丈夫のようです。残念ながら、Google AI Platform で GPU を使用できない理由を説明できる (またはできない) 上記のエラーがまだ残っています。

EDIT2: ここ ( https://www.tensorflow.org/install/gpu ) を読むと、私の Dockerfile は次のようになります。

問題は、キーボード構成と思われる段階でビルドがフリーズすることです。システムが国を選択するよう求めてきますが、番号を入力しても何も起こりません

ここに画像の説明を入力