ローカル デスクトップの RStudio セッションを、sparklyr を介してリモートの spark セッションに接続したいと考えています。RStudio の sparklyr ui タブで新しい接続を追加し、クラスターを選択すると、クラスターで実行するか、クラスターへの高帯域幅接続が必要であると表示されます。
その種の接続を作成する方法を明らかにできる人はいますか? これの再現可能な例を作成する方法はわかりませんが、一般的にやりたいことは次のとおりです。
library(sparklyr)
sc <- spark_connect(master = "spark://ip-[MY_PRIVATE_IP]:7077", spark_home = "/home/ubuntu/spark-2.0.0", version="2.0.0")
リモートサーバーから。特にリモート間でデータをやり取りしようとすると、遅延が発生することを理解しています。また、実際のクラスターに rstudio-server を配置した方がよいことも理解していますが、それが常に可能であるとは限りません。サーバーとデスクトップ RStudio セッションの間で対話するための sparklyr オプションを探しています。ありがとう。