1

EC2 で R を実行することを検討してきましたが、このセットアップでは並列/クラスター コンピューティングとの関係がどうなっているのか疑問に思っています。私は周りを見回しましたが、これに関するチュートリアルを見つけることができませんでした。

基本的に私がやろうとしているのは、ラップトップで R (Rstudio) を実行し、その上でほとんどの作業を行うことですが、実行する大きな操作がある場合は、それを明示的に AWS スレーブ インスタンスに渡してすべてを実行します。重労働。

私が見る限り、雪/降雪パッケージが答えのようです...しかし、どうすればよいかわかりません。

http://bioconductor.org/help/bioconductor-cloud-ami/ (ssh のもの)のチュートリアルを使用して、R を実行しています。このチュートリアルでは、並列/クラスターについて言及していますが、異なる AWS インスタンス間にあるようです。

どんな助けでも素晴らしいでしょう。乾杯。

4

1 に答える 1

0

スレーブ インスタンスが 1 つだけ必要な場合は、PC をマスターとして使用するよりも、インスタンス上で並列に実行するのが最も簡単であることがわかりました。

PC でスクリプトを作成し、R が実行されているマルチコア サーバーにプッシュしてから、そこですべてのコアを並列に使用して実行できます。

たとえば、これを 4 コアの AWS インスタンスにアップロードします。

library(snowfall)
sfInit(parallel=TRUE,cpus=4,slaveOutfile="log.txt")

vars = c(1:100)

#send variables to all processors
sfExportAll()

#Run this in parallel
results = sfLapply(vars, exp)

#Stop parallel processing
sfStop()

#save results
save(results, file = "results.RData")
于 2014-01-07T16:26:53.517 に答える