1

つまり、2 つのオプション : 1. オフライン コンピューティングも行う Hadoop クラスターに HBase をインストールします。つまり、Hadoop クラスターは 1 つだけです。2. オフライン コンピューティング用の Hadoop クラスターをインストールしてから、HBase 専用の別の Hadoop クラスターをインストールして、その HDFS を使用します。

したがって、2 つのオプションは次のとおりです。1 つは統合された Cluster で、もう 1 つは実際には 2 つのクラスターです。

これら2つのオプションの長所と短所は何ですか?

4

1 に答える 1

1

オプション 1: 統合クラスター。

長所: HBase を読み書きする MapReduce は、データの局所性としてより効率的です。

短所: HBase リージョン サーバーは、CPU とメモリを保持する必要があるため、マシン (Datanode と TaskTracker) のパフォーマンスを低下させます。MapReduce ジョブが多数ある場合、HBase のレイテンシーは数秒になる場合があります。したがって、HBase の応答を時間内に行いたい場合は、さらに作業が必要です (たとえば、memcache を使用して読み取りパフォーマンスを向上させるなど)。

オプション 2: 2 つのクラスター。

長所: HBase リージョン サーバーは、HDFS Datenode と TaskTracker のパフォーマンスに影響を与えません。

短所: MapReduce は、HBase にアクセスする場合、データをリモートで読み書きする必要があります。オプションには、より多くのマシンも必要です。

于 2013-07-11T01:41:29.670 に答える