1

分散コンピューティング環境で大規模なワークフローを管理できるオープンソースのリソースマネージャーを探しています。TORQUE、SLURM、LOADLEVELERについて調査を行いました。大きなノードの処理では、SLURMの方がTORQUEよりも優れていますが、単一のクラスターです。すべてバッチシステムに使用されます。コンドルはグリッド環境に使用されますが、粗粒度の分散型並列化を提供します。GangliaとNagiosは、ハイパフォーマンスコンピューティング環境に適していると思います。しかし、GangliaとNagiosをワークフローに使用できるかどうか知りたいですか?スケジューリングアルゴリズムをスケジューラーに組み込み、Hadoop MapReduceFrameworkを介してResourceManagerで使用できますか?役立つ返信をいただければ幸いです。ありがとうございました。

4

1 に答える 1

2

Ganglia と Nagios は監視ツールであり、リソース管理は提供しません。最新の Hadoop をチェックアウトします。内部的にリソース管理が同梱されています。

新しい ResourceManager はアプリケーションへのコンピューティング リソースのグローバルな割り当てを管理し、アプリケーションごとの ApplicationMaster はアプリケーションのスケジューリングと調整を管理します。

http://hadoop.apache.org/common/docs/r0.23.0/

于 2011-12-13T18:53:53.057 に答える