0

google-dataproc クラスタから pub-sub などの python google cloud api を使用/インストールする正しい方法は何ですか? たとえば、クラスターで zeppelin/pyspark を使用していて、pub-sub API を使用したい場合、どのように準備すればよいですか?

デフォルトのクラスタ プロビジョニング中に何がインストールされ、何がインストールされていないのか、Google クラウド API 用の Python ライブラリをインストールする必要があるかどうか、またはその方法が不明です。

さらに、セットアップにはスコープ/認証が必要な場合があることを認識しています。明確にするために、API をローカルで使用することはできますが、クラスターから API にアクセスできるようにする最もクリーンな方法が何であるかはわかりません。不要な手順は実行したくありません。

4

1 に答える 1

0

一般に、Java からGoogle Cloud Storage コネクタまたはBigQuery コネクタを使用するか、Java 実装に自動的にデリゲートする PySpark の RDD メソッドを介して使用しない限り、現時点では、さまざまな Google API 用に独自のクライアント ライブラリを用意する必要があります。

認証には、--scopes https://www.googleapis.com/auth/pubsuband/or--scopes https://www.googleapis.com/auth/cloud-platformを使用するだけで、Dataproc クラスタの VM のサービス アカウントは、デフォルトでインストールされた認証情報フローを介して PubSub を使用することを認証できます。

于 2016-03-31T17:34:19.900 に答える