azure - Azure Data Factory Parquet 動的スキーママージ

翻译自：https://stackoverflow.com/questions/62509544 2020-06-22T07:37:12.210

475 次

ADLS Gen2 に複数の Parquet ファイルがあり、parquet ファイルには異なる列/スキーマがありますが、すべての異なるスキーマは互いに互換性があります。ADF でデータセットを作成すると、68 列のうち 26 列しか検出されません (26 列はすべての寄木細工のファイルにあります)。pyspark を使用してファイルを読み取る場合、次の行を使用してさまざまなスキーマを動的にマージできます。

parquetFile = spark.read.option("mergeSchema", "true").parquet("./data/*/*/*/*/*/")

Azure Data Factory で同様の設定を行う方法はありますか?

ありがとうございました。

azure - Azure Data Factory Parquet 動的スキーマ マージ

0 に答える 0

Related

Reference

azure - Azure Data Factory Parquet 動的スキーママージ