apache-spark - 2/6 ワーカーにのみ接続するスタンドアロン Spark クラスターへの SparklyR 接続

翻译自：https://stackoverflow.com/questions/42069124 2017-02-06T13:34:47.037

473 次

RStudio を使用して、sparklyR 経由でスタンドアロンの Spark クラスター (CassandraDB のファイルストレージを使用) に接続するようにスタックをセットアップすることができました。

まだ解決できていない唯一の問題は、sparklyR 接続を取得して、クラスターで使用可能なすべてのワーカーノード (合計 6 つ) を利用する方法です。接続するたびに、Executor Summary ページに、sparklyR 接続で使用されているワーカーが 2 つだけ表示されます (各ノードに 1 つのエグゼキューターがあります)。

との設定をspark_connect含め、呼び出しの config.yml ファイルをいじってみましたが、違いはありません。すべてのノードを使用するように sparklyR を取得するために使用できる別の設定はありますか? すべてのワーカー IP アドレスのリストを渡して、それらすべてに接続することはできますか?spark.executor.instances: 6spark.num.executors: 6spark_connect

私のセットアップは次のとおりです: RStudio: 1.0.136、sparklyR: 0.5.3-9000、Spark バージョン (クラスター上およびローカル): 2.0.0。

apache-spark - 2/6 ワーカーにのみ接続するスタンドアロン Spark クラスターへの SparklyR 接続

1 に答える 1

Related

Reference