0

AWS EMR で豚のスクリプトを使用して、キネシス ストリームで一部のデータをバッチ処理しようとしています。ストリーム データをグループ化して s3 に移動するだけです。これを数時間ごとに実行しようとしています。最初は AWS Data Pipeline に非常に適しているように思えますが、kinesis チェックポイントに使用する反復回数を渡す方法がわかりません。数値をインクリメントして pig スクリプトに渡す方法はないようです。ここで例を見てきました。これには、常時稼働のクラスターと、反復回数を増やす crontab スクリプトが含まれています。不足している AWS Data Pipeline を使用してこれを達成する方法はありますか?

4

1 に答える 1