hbase の学習を始めましたが、線形にスケーリングする方法がわかりません。
問題は、hbase をインストールする前に、hdfs クラスターが必要なことです。HDFS クラスターには、クラスター全体で 1 つしか存在できないマスター ノードがあるため、ボトルネックになります。もちろん、もう 1 つのマスター ノードを実行できます (もう 1 つのマスター ノードしか実行できません) が、スタンバイ状態になります。私が理解しているように、hbase は HDFS クラスターを使用してデータを保存します。したがって、私にとって論理的には、複数の Hmaster を実行しても意味がありません。なぜなら、すべてのリクエストが hdfs アクティブ マスターに送信され、リクエストが多すぎるとパフォーマンスが低下する可能性があるためです。
また、hdfsと同じノードにhbaseをインストールする必要があるのか 、それとも個別にインストールする必要があるのか を正しく理解していません。HDFS とは別に hbase を実行すると、どのような利点がありますか。私にとっては、次の例のように、hbase クラスターを hdfs と同じノードにインストールするのが論理的です。
HDFS active master - HMaster
HDFS standby master - HMaster backup
HDFS Data node - HRegion server
hdfs マスターと hmaster を分離すると、hbase クラスターが失われる可能性が 2 倍になるため、私にとってはこれが最も論理的な構造です。
誰かがこれらすべてについて情報を共有できれば、とてもうれしいです。hbaseがどのように線形にスケーリングできるか、そしてhdfsでどのように機能するかを本当に理解していないからです。