slurm によって管理されるクラスターを使用して、yarn/hadoop ベンチマークを実行しています。これを行うために、slurm によって割り当てられたノードで Hadoop サーバーを起動し、それらでベンチマークを実行しています。これは本番環境の Hadoop クラスターを実行するための意図された方法ではありませんが、必要があることは理解しています。
これを行うために、srun などで実行されるスクリプトを作成することから始めましたsrun -N 4 setup.sh
。このスクリプトは構成ファイルを書き込み、割り当てられたノードでサーバーを起動します。最も小さい番号のマシンがマスターとして機能します。これはすべて機能し、アプリケーションを実行できます。
ただし、サーバーを一度起動してから、最初にすべてを再起動/エンコードせずに複数のアプリケーションを起動したいので、salloc
代わりに使用したいと思います。salloc -N 4
これは、 を実行してから実行する単純なケースだと思っていましたsrun setup.sh
。残念ながら、異なるサーバーが互いに通信できないため、これは機能しません。thenを使用する場合srun
と使用する場合の動作環境の違いを説明してくれる人はいますか?salloc
srun
どうもありがとう
ダニエル