apache-spark - AWS Glue が paruqet ファイルに追加

翻译自：https://stackoverflow.com/questions/57519609 2019-08-16T06:06:56.107

745 次

私は現在、AWS を利用したデータレイクの設計を進めています。

私が今持っているもの：

etl ジョブがデータを変換するたびに、新しい parquet ファイルが作成されます。データを保存する最も効率的な方法は、単一の寄木細工のファイルであると思います。そうですか？もしそうなら、これを達成する方法。

1 に答える 1