google-cloud-platform - ローカルの Jupyter Notebook から Dataproc で Koalas を使用する方法

翻译自：https://stackoverflow.com/questions/70674535 2022-01-11T23:13:23.217

48 次

Google のドキュメントを確認したところ、Spark ジョブを Dataproc クラスタに送信し、クラスタ内に JupyterLab をインストールして、ノートブックで反復操作を実行できました。

しかし、DataProc クラスターリソースを使用してローカルの Jupyer Notebook (自分のマシン上) から反復コマンドを実行するための適切な構成を見つけることができませんでした。

ローカルの JupyterLab からクラスターを作成し、pySpark (Koalas) を使用して、BigQuery と GCS でホストされている大規模なデータフレームに対して一連の操作を実行することに特に興味があります。私の目標は、クラスタマシンまたは Vertex IA 内の JupyterLab インストールにアクセスするのと同じ方法で、ローカルの JupyerLab で Dataproc を使用することです。

誰もそれを構成する方法を知っていますか?

google-cloud-platform - ローカルの Jupyter Notebook から Dataproc で Koalas を使用する方法

1 に答える 1

Related

Reference