5 テラバイトの mongodb データがあり、クライアントはデータを Hadoop に移動して処理したいと考えています。
私たちの要件は、MongoDB から HDFS にデータをロードして処理し、別のランダム アクセス DB に格納することです。
私たち(チーム)の考えは、mongo-hadoop ドライバーを使用して mongoDB から HDFS にデータをロードし、それを HIVE で処理し、ランダム アクセスのためにデータを HBASE にロードすることです。
それで、これを行うための他のより良い方法はありますか?あなたの提案を提供してください。
参考: 20 ノードのクラスターがあります。