EMR とスキャンの両方がテーブル全体を解析し、リクエスト クレジットを消費しますが、EMR は ec2 インスタンスも使用する必要があるため、はるかに多くのコストがかかります。
では、どの場合に EMR が Amazon の Scan on Amazon の Dynamo-DB よりも適しているのだろうか?
EMR とスキャンの両方がテーブル全体を解析し、リクエスト クレジットを消費しますが、EMR は ec2 インスタンスも使用する必要があるため、はるかに多くのコストがかかります。
では、どの場合に EMR が Amazon の Scan on Amazon の Dynamo-DB よりも適しているのだろうか?
申し訳ありませんが、あなたの質問を完全に理解しているとは言えません。
直接スキャンを行うのではなく、EMR を使用して DynamoDB テーブル全体をスキャンする理由を尋ねる場合、答えはスピードとシンプルさです。
DynamoDB Serde で Hive のようなものを使用すると、スキャンが並列化されるため、DynamoDB に直接クエリを実行するよりもはるかに高速に DynamoDB テーブルの内容全体を抽出できます。
DynamoDB は一貫した読み取りパフォーマンスをサポートしているため、多くの場合、DynamoDB テーブルをクエリするとき、ボトルネックはクライアントがデータを十分に高速に読み取ることができるようになります。