4 つの異なるアクティビティで構成されるパイプラインがあります。各アクティビティは、次のアクティビティの前提条件です。つまり、最初のアクティビティは 2 番目のアクティビティの入力を生成し、2 番目のアクティビティは 3 番目のアクティビティの入力を生成します。すべての入力フォルダーと出力フォルダーをテーブルとして定義し、パイプラインで各ジョブの出力を次のように追加しました。次へのインプット。
私の仮定では、各アクティビティが実行されて出力フォルダーが生成され、次のアクティビティがそれを入力として受け取ります。ただし、パイプラインを実行すると、最初のアクティビティは正常に終了しますが、2 番目のアクティビティを実行すると、最初のアクティビティが実行されているように見えます。必要なパラメーターを渡しませんでした)! アクティビティの実行方法に何か欠けていますか?
私のアクティビティは HDInsight アクティビティです。
私は Oozie のバックグラウンドを持っており、パイプラインを Oozie ワークフローと考えています。