1

ハイブテーブルがあります。ここで、ジョブが特定の場所にあるファイルを毎日検索するワークフローを作成する必要があります -

/data/data_YYYY-mm-dd.csv
like
/data/data_2015-07-07.csv
/data/data_2015-07-08.csv
...

したがって、毎日のワークフローは自動的にファイル名を選択し、データを Hive テーブル (MyTable) にロードします。

以下のようにロードのスクリプトを書いています- LOAD DATA INPATH "/data/${filepath}" OVERWRITE INTO TABLE MyTable.

プレーンなハイブ ジョブと同じように実行しているときに、ファイル パスを data_2015-07-07.csv として設定できますが、Oozie コーディネーターでそれを行う方法で、名前が日付のパスが自動的に選択されるようにします。

Oozie コーディネーターからワークフロー パラメーターを設定しようとしました-

clicklog_${YYYY}-{MONTH}-{DAY}.csv
4

1 に答える 1