hadoop - Amazon Elastic MapReduce Bootstrap アクションが機能しない

Question

ジョブのヒープサイズを増やすために、次のブートストラップアクションの組み合わせを試しましたが、どれも機能していないようです。

--mapred-key-value mapred.child.java.opts=-Xmx1024m 
--mapred-key-value mapred.child.ulimit=unlimited

--mapred-key-value mapred.map.child.java.opts=-Xmx1024m 
--mapred-key-value mapred.map.child.ulimit=unlimited

-m mapred.map.child.java.opts=-Xmx1024m
-m mapred.map.child.ulimit=unlimited 

-m mapred.child.java.opts=-Xmx1024m 
-m mapred.child.ulimit=unlimited

正しい構文は何ですか?

score 7 · Accepted Answer

これを実現するには、次の 2 つのオプションがあります。

カスタム JVM 設定

カスタム設定を適用するには、Amazon Elastic MapReduce (Amazon EMR)の Bootstrap Actionsドキュメント、具体的にはアクションConfigure Daemonsを参照することをお勧めします。

この定義済みのブートストラップアクションを使用すると、Hadoop デーモンのヒープサイズまたはその他の Java 仮想マシン (JVM) オプションを指定できます。このブートストラップアクションを使用して、Hadoop がデフォルトで割り当てるよりも多くのメモリを必要とする大規模なジョブ用に Hadoop を構成できます。このブートストラップアクションを使用して、ガベージコレクション動作などの高度な JVM オプションを変更することもできます。

ヒープサイズを 2048 に設定し、Java namenode オプションを構成する例も提供されています。

$ ./elastic-mapreduce –create –alive \
  --bootstrap-action s3://elasticmapreduce/bootstrap-actions/configure-daemons \
  --args --namenode-heap-size=2048,--namenode-opts=-XX:GCTimeRatio=19

事前定義された JVM 設定

または、FAQ に従って、ジョブフローの Hadoop 設定を構成するにはどうすればよいですか? ジョブフロータスクが大量のメモリを消費する場合は、コアあたりのタスク数を減らし、ジョブトラッカーのヒープサイズを減らすことを選択できます。この状況では、事前定義された Bootstrap アクションを使用して、起動時にジョブフローを構成できます。これは、クラスター全体の Hadoop 設定をメモリ集約型のジョブフローに適した値に設定できるアクションConfigure Memory-Intensive Workloadsを指します。たとえば、次のようになります。

$ ./elastic-mapreduce --create \
--bootstrap-action \
  s3://elasticmapreduce/bootstrap-actions/configurations/latest/memory-intensive

この定義済みのブートストラップアクションによって適用される特定の構成設定は、Hadoop メモリ集約型の構成設定に一覧表示されています。

幸運を！

hadoop - Amazon Elastic MapReduce Bootstrap アクションが機能しない

2 に答える 2

カスタム JVM 設定

事前定義された JVM 設定

Related

Reference