EC2 で Hadoop (1.0.4) を手動でセットアップ/構成するのに役立つリソースを教えてください。ツールやサービスなどを使用してこれを達成するためのリソースがたくさんあることに同意しますが、私が探しているのは、スレーブとマスターの両方の conf/*.xml ファイルに手動でどのような変更を加える必要があるかを理解するための助けです。 Hadoop を動作させます。
現在、私は 5 つの ec2 インスタンスを実行しており、それらはすべて疑似分散モードで Hadoop ジョブを個別に実行できます。そのため、conf ファイルを構成することで、1 つをマスターに、残りをスレーブにする必要があります。これにより、スレーブは namenode と jobtracker がどこにあるかを認識し、マスターはすべてのスレーブを認識するようになります。
私の理解では、インスタンスの EC2 セキュリティ グループも構成して、すべてのインスタンスが正しいポートで互いに通信できるようにする必要があります。私はこれで大丈夫だと思います。
誰かが構成部分で私を助けてくれますか、または役立つかもしれない何かを教えてくれますか?