問題タブ [oozie-coordinator]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
825 参照

hadoop - Oozie ワークフローおよびコーディネーター

ワークフロー用とコーディネーター用の 2 つのプロパティ ファイルがあります。./job.properties および ./coordinator/job.properties

2 つのファイルは、コーディネーターにいくつかの追加の変数が設定されていることを除いて同一です。以下はそれらの変数です

ワークフローを実行するとすべて問題ありませんが、コーディネーター エラーを実行するとエラーが発生します: エラー: E0301 : E0301: 無効なリソース [ファイル名]

そのファイル名が存在し、hadoop fs -ls [ファイル名] を実行するとリストされます。

ここで何が間違っていますか。

ありがとう

0 投票する
1 に答える
183 参照

hive - Oozie コーディネーターの Hive クエリ

Oozie コーディネーターを使用して 10 個のハイブ スクリプトを実行しています。reduce ステージのスクリプトの 1 つにエラーが発生せずに同じ割合でスタックしています。スクリプトは単純な挿入ステートメントであり、コマンド ラインでテストしましたが、正常に動作しました。デバッグ方法を教えてください。これ?

0 投票する
1 に答える
1291 参照

hadoop - Oozie コーディネーターが指定された頻度間隔で実行されていない

Oozie コーディネーターのジョブを次のように定義しました。

ご覧のとおり、頻度を 15 分、同時実行数を 1 と定義しました。

ただし、ジョブは 5 分ごとに実行され、次のスクリーンショットに示すように、ワークフローの 4 つのインスタンスが同時に起動されます。

ウージーのスクリーンショット

なぜこれが起こっているのかわかりません。洞察をいただければ幸いです。

0 投票する
1 に答える
190 参照

bigdata - OOZIE - 不明なファイル名でコーディネーター アプリを作成する

ファイルのリストでコーディネーター アプリを作成したいのですが、その名前の部分しかわかりません: /data/trigger/projet/*

次の HDFS URL を解決したい:

次のコードを試すと、oozie は何も検出せず、WAITING 状態のままになります。

0 投票する
1 に答える
4455 参照

hadoop - フォークを使用し、結合を使用しない Oozie ジョブ

独立して実行される 3 つのジョブをフォークする必要があるワークフローを作成しています。参加する必要はありません。これをoozieで達成する方法はありますか? フォークとの参加は必須ですか??

0 投票する
0 に答える
1414 参照

hadoop - oozie java.lang.RuntimeException: オブジェクトの構成中にエラーが発生しました

Oozieワークフローでエラーを下回っています。誰か助けてもらえますか? CDH4

0 投票する
1 に答える
1744 参照

oozie - Oozie での厳密なコーディネーターのジョブ オーダー

私は、一連のタスクを実行する oozie のコーディネーターを持っています。各タスクは、最後の出力に依存します。各タスクは日付付きフォルダーを出力し、次を使用してその前のタスクの出力を探します

これは、他に何も実行されていないときに、開発クラスターですべて正常に機能しました。oozie は 5 分ごとに別のジョブをキューに入れ、その 5 分の間に前のジョブが実行されていたため、新しいジョブがセットアップされると、必要なディレクトリが表示されます。

本番クラスターで問題が発生しました。ジョブは送信されますが、キューに入れられ、しばらく実行されませんが、それでも 5 分ごとに oozie が別のジョブをキューに入れ、初期化段階で「前の」フォルダーが割り当てられます。前のジョブが実行されていないため、まだ作成されていないため、「latest」関数は前のジョブと同じ入力を提供します。その後、10 個のジョブがすべて同じ入力を受け取ることになります...

私が必要としているのは、コーディネーター シーケンスの次のジョブが、前のジョブの実行が完了するまで作成されないようにする方法です。これを行う方法はありますか?

読んでくれてありがとう