25

Udacity Deep Learning の課題に取り組んでいるときに、メモリの問題に遭遇しました。クラウド プラットフォームに切り替える必要があります。以前は AWS EC2 を使用していましたが、現在は Google Cloud Platform (GCP) を試してみたいと考えています。少なくとも 8GB のメモリが必要です。docker をローカルで使用する方法は知っていますが、クラウドで試したことはありません。

  1. GCP で Tensorflow を実行する既製のソリューションはありますか?
  2. そうでない場合、どのサービス (Compute Engine または Container Engine) を簡単に開始できますか?
  3. 他のヒントも大歓迎です!
4

6 に答える 6

22

答えをまとめると:

Compute Engine で TensorFlow を手動で実行する手順:

  1. プロジェクトを作成する
  2. Cloud Shellを開きます (上部のボタン)。
  3. マシン タイプの一覧表示: gcloud compute machine-types list。次のコマンドで使用したマシン タイプを変更できます。
  4. インスタンスを作成します。
gcloud compute instances create tf \
  --image container-vm \
  --zone europe-west1-c \
  --machine-type n1-standard-2
  1. 実行sudo docker run -d -p 8888:8888 --name tf b.gcr.io/tensorflow-udacity/assignments:0.5.0(イメージ名を目的のものに変更)
  2. ダッシュボードでインスタンスを見つけて、ネットワークを編集しdefaultます。
  3. ファイアウォール ルールを追加して、IP、プロトコル、およびポートを許可しますtcp:8888
  4. ダッシュボードからインスタンスの外部 IP を見つけます。IP:8888ブラウザで開きます。終わり!
  5. 終了したら、作成したクラスターを削除して課金を回避します。

これが私がやった方法で、うまくいきました。もっと簡単な方法があると確信しています。

その他のリソース

以下について詳しく知りたいと思われるかもしれません:

知っておくと便利

  • 「Cloud Shell ホーム ディレクトリの内容は、仮想マシンが終了して再起動された後でも、すべての Cloud Shell セッション間でプロジェクト間で保持されます」
  • 使用可能なすべてのイメージ バージョンを一覧表示するには:gcloud compute images list --project google-containers

@user728291、@MattW、@CJCullen、@zain-rizvi に感謝します。

于 2016-04-29T00:36:46.867 に答える
2

事前構成済みの DeepLearningイメージも使用できるようになりました。TensorFlow に必要なものはすべて揃っています。

于 2018-08-09T21:30:06.727 に答える
1

これは古い質問ですが、新しい、さらに簡単なオプションがあります。

Jupyter Lab で TensorFlow を実行する場合

GCP AI Platform Notebooks。これにより、Tensorflow がプリインストールされた Jupyter Lab Notebook にクリックでアクセスできます (必要に応じて、代わりに Pytorch、R、または他のいくつかのライブラリを使用することもできます)。

生の VM を使用するだけの場合

Jupyer Lab を気にせず、Tensorflow がプリインストールされた raw VM だけが必要な場合は、代わりに GCP のDeep Learning VM Imageを使用して VM を作成できます。これらの DLVM イメージは、Tensorflow がプリインストールされた VM を提供し、必要に応じて GPU を使用するようにすべてセットアップされています。(AI Platform Notebooks はこれらの DLVM イメージを内部で使用します)

ラップトップとクラウドの両方で実行したい場合

最後に、個人のラップトップとクラウドの両方で tensorflow を実行できるようにしたい場合で、Docker の使用に慣れている場合は、GCP のDeep Learning Container Imagesを使用できます。DLVM イメージとまったく同じセットアップが含まれていますが、代わりにコンテナーとしてパッケージ化されているため、好きな場所でこれらを起動できます。

追加の利点: このコンテナー イメージをラップトップで実行している場合は、100% 無料です:D

于 2019-08-02T22:52:29.047 に答える
0

Google Cloud プラットフォームにとどまる必要があるかどうかはわかりません。他の製品を使用できる場合は、多くの時間とお金を節約できます。

TensorFLow を使用している場合は、 TensorPortというプラットフォームをお勧めします。これは TesnorFlow 専用で、私が認識している簡単なプラットフォームです。コードとデータは git で読み込まれ、リモート マシンとローカル マシンの間でパスを自動的に切り替えるための Python モジュールが提供されます。また、必要に応じて、分散コンピューティングをセットアップするための定型コードもいくつか提供しています。お役に立てれば。

于 2017-08-02T18:18:16.223 に答える