Hadoop をインストールして作成した EC2 イメージがあります。ただし、インスタンス化時にロールレスになるように設定しました (スレーブでもマスターでもありません)。Hadoop クラスターを開始するために、EC2 で必要な数のインスタンス (ノード) を起動します。次に、各ノードに対して次の 3 つのことを行う必要があります。
- /etc/hosts を更新して、必要な IP アドレスを含めます。
- マスター ノードの場合、$HADOOP_HOME/conf/masters と $HADOOP_HOME/conf/slaves を変更します。
- ノード間の SSH アクセスを有効にします。
これを自動的に行う方法を見つけて、任意の数のノードに対して、各ノードでこれらすべての設定を行う必要がないようにしたいと考えています。
他の人は Hadoop クラスターの自動セットアップをどのように処理していますか? ネットワーク部分を自動化する方法はありますか?
毎回IPアドレスが違うのでできるかどうかはわかりませんが、他の人が何を試したのか、よく使われているものを知りたいです。これらのプロセスを自動化して、テスト用にクラスターをセットアップするたびに、すべてのノードに対してこれらを行う必要がないようにする良い方法はありますか? Linux スクリプトについてはよくわかりませんが、これはスクリプトで可能ですか? それとも、すべてのノードを手動で構成する必要がありますか?