AmazonがホストするApacheHiveの仕組みを理解したいと思っています。私は、HDFSをS3に、HadoopMapReduceをEMRに置き換えていると思います。私の仮定は正しいですか?
質問する
202 次
1 に答える
0
あなたはほとんど正しいです。Amazon で Hive を実行する最も便利な方法は、HDFS を S3 に置き換えることです。データは S3 上にあり、Hadoop / Hive クラスターをオンデマンドで実行できるため、実用的です。いくつかの欠点は、書き込みパフォーマンスが遅いことです。そのため、データ変換を行うと遅くなります。集約を行う - ほとんど問題
ありません 同時に、他の構成もあります:
ローカルドライブ上に HDFS を構築します。
EBS ボリューム上に HDFS を構築します。
それぞれにトレードオフがあります。
于 2012-09-12T07:33:04.557 に答える