AWSSDKforPHP を使用して emr インスタンスを起動し、豚のスクリプトを実行しましたが、耐えられないほど遅いことがわかりました。ピッグ ローカル モードの ec2 インスタンスで同じピッグ ジョブを実行すると、わずか 10 分しかかかりません。EMR を開始してピグ ジョブを mapreduce モードで実行すると、数時間かかります。変ですね。mapreduce モードの内部 Hadoop クラスターで同様の pig ジョブを実行していましたが、非常に高速です。指定する必要がある構成設定はありますか? emr 用に 1 つのマスター ノードと 4 つのスレーブ ノードを既に設定していますが、まだ十分ではありませんか??
ありがとう。