データ パイプラインを介して実行しているクラスターにインスタンス ロールをアタッチしようとしています。書き込み権限が必要な独自のマッパー スクリプトを実行したいと考えていますDynamoDB
(「通常の」HIVE アップロードではうまくいきません)。
API ドキュメントを調べたところ、EMR はマシンのインスタンス ロールを指定できますが、データ パイプライン API ではサポートされていないようです。
これを確認するためにここに尋ねて、他の解決策があるかどうか聞いてみたい..
データ パイプラインを介して実行しているクラスターにインスタンス ロールをアタッチしようとしています。書き込み権限が必要な独自のマッパー スクリプトを実行したいと考えていますDynamoDB
(「通常の」HIVE アップロードではうまくいきません)。
API ドキュメントを調べたところ、EMR はマシンのインスタンス ロールを指定できますが、データ パイプライン API ではサポートされていないようです。
これを確認するためにここに尋ねて、他の解決策があるかどうか聞いてみたい..
アップデート:
Data Pipeline は、役割によるクラスターの作成をサポートするようになりました。このドキュメントを見てください。
Data Pipeline は、ロールを使用した EMR クラスターの作成をサポートしていませんが、引き続き EMR クラスターを使用できます。認証情報は、IAM ユーザー ポリシーに基づくクラスターに基づいて利用できます。DynamoDB への書き込み権限を IAM ユーザー ポリシーに追加し、そのユーザーを使用してパイプラインを開始し、その中で EMR クラスターを使用します。