これが SO で既に回答されているかどうかはわかりませんが、問題の解決策が見つかりませんでした。
Google Container Engine の docker コンテナで IPython ノートブックを実行しています。コンテナはこのイメージjupyter/all-spark-notebookに基づいています
Google Cloud Dataprocで作成された Spark クラスターもあります
Spark マスターとノートブックは、異なる VMで実行されていますが、同じリージョンとゾーンで実行されています。
私の問題は、IPython ノートブックからスパーク マスターに接続しようとしていますが、成功していないことです。Pythonノートブックでこのコードスニペットを使用します
import pyspark
conf = pyspark.SparkConf()
conf.setMaster("spark://<spark-master-ip or spark-master-hostname>:7077")
私はスパークを使い始めたばかりなので、何か(認証、セキュリティ...)が欠けていると確信しています。
そこで見つけたのは、 SSH トンネルを介してローカル ブラウザを接続していることです。
誰かがすでにこの種のセットアップを行っていますか?
前もって感謝します