7

Snow を使用して R で並列ジョブを実行しようとしています。古いバージョンの R と Snow で、非常によく似たジョブを問題なく実行できました。R パッケージの依存関係により、元に戻すことができません。

何が起こるか:私のジョブはparRapplyステップで終了します。つまり、ノードが最初にレポート以外のことをしなければなりませんSys.info()。エラーメッセージは次のとおりです。

Error in checkForRemoteErrors(val) : 
3 nodes produced errors; first error: cannot open the connection 
Calls: parRapply ... clusterApply -> staticClusterApply -> checkForRemoteErrors

仕様: R 2.14.0、snow 0.3-8、RedHat Enterprise Linux Client リリース 5.6。Snow パッケージは、正しいバージョンの R でビルドされています。

詳細: 次のコードは正常に実行されるようです。

cl <- makeCluster(3)
clusterEvalQ(cl,library(deSolve,lib="~/R/library"))
clusterCall(cl,function() Sys.info()[c("nodename","machine")])

私はエンド ユーザーであり、システム管理者ではありませんが、何がうまくいかないのかについての提案や洞察を切望しています。

4

1 に答える 1

18

この不可解なエラーは、プログラムの実行中に要求された入力ファイルが実際には存在しなかったために発生しました。各ノードはこのファイルをロードしようとして失敗しますが、これは「接続を開くことができません」というメッセージのみを表示します。

これが意味することは、ほとんどすべてが「接続」エラーを引き起こす可能性があるということです。信じられないほど迷惑です!

于 2011-12-17T20:52:54.307 に答える