2

5 テラバイトの mongodb データがあり、クライアントはデータを Hadoop に移動して処理したいと考えています。

私たちの要件は、MongoDB から HDFS にデータをロードして処理し、別のランダム アクセス DB に格納することです。

私たち(チーム)の考えは、mongo-hadoop ドライバーを使用して mongoDB から HDFS にデータをロードし、それを HIVE で処理し、ランダム アクセスのためにデータを HBASE にロードすることです。

それで、これを行うための他のより良い方法はありますか?あなたの提案を提供してください。

参考: 20 ノードのクラスターがあります。

4

0 に答える 0