0

Apache Flink を使用して HDFS にいくつかのアーカイブ データ ファイルを作成しました。生成されたファイル名は part-{parallel-task}-{count} のようなパターンですが、Apache Spark によって直接ロードできる ".gz" 接尾辞が必要です。

Apache Flink の BucketingSink によって生成された最終的な完成ファイルに接尾辞を追加する API が見つかりませんが、InProgress、Pending、および ValidLength 状態にのみ接尾辞を追加できます。誰でも助けることができますか? HDFS コネクタJava API

4

1 に答える 1