私は Hadoop、HBase、Hive の初心者です。Hadoop、HBase、および Hive を疑似分散モードでインストールしたところ、すべて正常に動作しました。現在、Hive、HBase、および ZooKeeper を使用して単純な Hadoop クラスター (5 ノード) をセットアップすることを計画しています。以前にいくつかのドキュメントと指示を読んだことがありますが、質問に対する適切な説明が見つかりませんでした。すべてのデーモンを実行する場所がわかりません。これは私の考慮事項です:
Node_1 (マスター)
NameNode
ジョブトラッカー
HBase マスター
ZooKeeper (スタンドアロン ノード、HBase で管理)
Node_2 (バックアップ_マスター)
セカンダリ名ノード
Node_3 (スレーブ 1)
DataNode1
TaskTracker1
地域サーバー1
Node_4 (スレーブ 2)
DataNode2
TaskTracker2
RegionServer2
Node_5 (スレーブ3)
- DataNode3
- TaskTracker3
- RegionServer3
本番環境では、ZooKeeper アンサンブルを奇数のノード (個別のクラスター) で実行することをお勧めします。しかし、単純なクラスターの場合、マスター ノードで実行されるスタンドアロンの ZooKeeper ノードをセットアップしても問題ないでしょうか?
もう 1 つの質問は Hive に関するものです。Hive が Hadoop クライアントであることは知っています。マスター ノードにも Hive をインストールする必要がありますか? それは理にかなっていますか?
すべてのヒントとコメントをありがとう!ハカン
注: クラスターをシミュレートするマシンは 5 台しかありません。