Amazon Elastic mapreduce でクラスターを開始し、1 つのマスター ノード インスタンス、2 つのコア ノード インスタンス、15 のタスク ノード インスタンスがあるとします。
mapreduce ジョブと増分アップロードを使用して、約 1 TB のデータを hbase にアップロードしたと思います。
今 -
テーブル サイズと領域分割 (バイト) を確認するにはどうすればよいですか。通常、CDH では、hadoop fs -du /hbase を実行します。しかし、マスター ノードに /hbase ディレクトリがありません。
また、地域サーバーの割り当てがどのように機能するかについても知りたいです。つまり、100 のリージョンがある場合でも (マスター ノードが 1 つある場合)、IO 全体が適切に調整されることを意味します。
ありがとうございます。それでは、お元気で