hadoop - Apache NiFi/Hive - マージされたツイートを HDFS に保存し、ハイブにテーブルを作成する

翻译自：https://stackoverflow.com/questions/36773654 2016-04-21T15:07:35.710

281 次

次のワークフローを作成したい:

1.GetTwitter プロセッサを使用してツイートをフェッチします。

MergeContent プロセスを使用して、ツイートをより大きなファイルにマージします。
マージされたファイルを HDFS に保存します。
Hadoop/Hive 側では、これらのツイートに基づいて外部テーブルを作成したいと考えています。

これを行う方法の例がありますが、私が欠けているのは、MergeContent プロセッサを構成する方法です。ヘッダー、フッター、区切り記号として何を設定するかです。そして、マージされたツイートを行に分割するために、ハイブ側でセパレーターとして使用するもの。私が自分自身を明確に説明したことを願っています。

前もって感謝します。

hadoop - Apache NiFi/Hive - マージされたツイートを HDFS に保存し、ハイブにテーブルを作成する

1 に答える 1

Related

Reference