1

クラスター上の他のアプリケーションとうまく連携するように Hadoop をセットアップすることは可能ですか?

私は Torque+Maui リソース スケジューラと、HadoopOnDemand を使用して一時的な Hadoop クラスターをプロビジョニングすることに精通しています。しかし、多くの人が Hadoop を使用したい場合、それはかなり面倒です。それぞれの人が、自分のミニ Hadoop クラスターをセットアップして破棄し、自分の HDFS との間でデータをコピーするなど、同じ頭痛の種を抱えています。

常に稼働している HDFS を使用して、人々が共有する Hadoop の永続的なインスタンスを 1 つ実行できれば、はるかに優れたものになるでしょう。これには、Hadoop が他のアプリケーション (たとえば R など) でビジーでないノードに作業をインテリジェントに割り当て、ジョブをキューに入れるときに貪欲にならないようにする必要があります。

これは可能ですか?

4

1 に答える 1

0

これは公正なスケジューラーが行うことではありませんか?

http://hadoop.apache.org/mapreduce/docs/r0.21.0/fair_scheduler.html

これを使用して、30 人のユーザーで永続的な Hadoop クラスターを実行します。タスクを先取りして新しいプールに再割り当てすることができ、各プールに個別の優先順位を設定することもできます。

于 2012-05-07T21:32:44.227 に答える