8

私は DynamoDB を初めて使用します。このキーと値のペアのデータ ストアからレポートを生成するのと、DBMS からレポートを生成するのに違いがあるのではないかと思います。

私の (Java) アプリケーションはデータを DynamoDB に書き込みます。そこからビジネス レポート (たとえば、販売レポート) を生成したいと考えています。

私が理解しているのは、Amazon が EMR (elastic Map Reduce) を提供していることです。さらに読むと、その下に Hive があり、SQL のような構文を使用して DynamoDB にクエリを実行できるようになります。

私のデータは 50GB 未満である必要がありますか? このタスクに EMR を使用するのはやり過ぎですか?

4

1 に答える 1

7

はい、ハイブは SQL のような構文を使用します。Hive はまだ Java で書かれており、内部ではまだ Java です。Hive wikiは、開始するのに適した場所です。EMR での Dynamo DB の使用に関する優れた記事は次のとおりです http://aws.amazon.com/articles/28549

私のデータは 50GB 未満である必要がありますか? このタスクに EMR を使用するのはやり過ぎですか?

EMR をセットアップし、dynamo テーブルを s3 または内部 Hadoop テーブルにエクスポートしたら、そうは思いません。その後、DynamoDB の暫定的なスループット容量に影響を与えることなく、S3 または内部 Hadoop テーブルにクエリを実行できます。S3 は非常に高速であるため、あらゆる種類の複雑なハイブ クエリを記述して、必要なレポートを取得できます。

EMR を起動するためのコマンド ライン ツールはセットアップが非常に簡単で、お金を節約したい場合はいつでもスポット インスタンスに入札できます。

また、ジョブの実行速度が遅い場合は、必要に応じて、コア ノードとタスク ノードを増やして、ジョブをすばやく実行することができます。

于 2013-03-06T00:22:15.300 に答える