Kafkaトピックで約2000000のメッセージがあり、NiFiを使用してこれらのレコードをHDFSに入れたいので、これにPutHDFS
プロセッサを使用してConsumeKafka_0_10
いますが、HDFSに小さなファイルが生成されるため、レコードをマージするためにMerge Contentプロセッサを使用していますファイルをプッシュする前に。
設定の変更が必要な場合は助けてください これは少数のメッセージには問題なく機能しますが、大量のデータを含むトピックに関しては、レコードごとに 1 つのファイルを書き込みます。
ありがとうございました!!