amazon-dynamodb - Dynamodb からのレポートの生成

Question

私は DynamoDB を初めて使用します。このキーと値のペアのデータストアからレポートを生成するのと、DBMS からレポートを生成するのに違いがあるのではないかと思います。

私の (Java) アプリケーションはデータを DynamoDB に書き込みます。そこからビジネスレポート (たとえば、販売レポート) を生成したいと考えています。

私が理解しているのは、Amazon が EMR (elastic Map Reduce) を提供していることです。さらに読むと、その下に Hive があり、SQL のような構文を使用して DynamoDB にクエリを実行できるようになります。

私のデータは 50GB 未満である必要がありますか? このタスクに EMR を使用するのはやり過ぎですか?

score 7 · Accepted Answer

はい、ハイブは SQL のような構文を使用します。Hive はまだ Java で書かれており、内部ではまだ Java です。Hive wikiは、開始するのに適した場所です。EMR での Dynamo DB の使用に関する優れた記事は次のとおりです http://aws.amazon.com/articles/28549

私のデータは 50GB 未満である必要がありますか? このタスクに EMR を使用するのはやり過ぎですか?

EMR をセットアップし、dynamo テーブルを s3 または内部 Hadoop テーブルにエクスポートしたら、そうは思いません。その後、DynamoDB の暫定的なスループット容量に影響を与えることなく、S3 または内部 Hadoop テーブルにクエリを実行できます。S3 は非常に高速であるため、あらゆる種類の複雑なハイブクエリを記述して、必要なレポートを取得できます。

EMR を起動するためのコマンドラインツールはセットアップが非常に簡単で、お金を節約したい場合はいつでもスポットインスタンスに入札できます。

また、ジョブの実行速度が遅い場合は、必要に応じて、コアノードとタスクノードを増やして、ジョブをすばやく実行することができます。

amazon-dynamodb - Dynamodb からのレポートの生成

1 に答える 1

Related

Reference