amazon-web-services - Glue での ResolveChoice の使用

翻译自：https://stackoverflow.com/questions/63777573 2020-09-07T12:24:16.877

1141 次

ある S3 バケットから別のバケットにデータを取り込む小さなグルージョブを作成できましたが、コードの最後の数行については明確ではありません (以下)。

applymapping1 = ApplyMapping.apply(frame = datasource_lk, mappings = [("row_id", "bigint", "row_id", "bigint"), ("Quantity", "long", "Quantity", "long"),("Category", "string", "Category", "string") ], transformation_ctx = "applymapping1")

selectfields2 = SelectFields.apply(frame = applymapping1, paths = ["row_id", "Quantity", "Category"], transformation_ctx = "selectfields2")

resolvechoice3 = ResolveChoice.apply(frame = selectfields2, choice = "MATCH_CATALOG", database = "mydb", table_name = "order_summary_csv", transformation_ctx = "resolvechoice3")

datasink4 = glueContext.write_dynamic_frame.from_catalog(frame = resolvechoice3, database = "mydb", table_name = "order_summary_csv", transformation_ctx = "datasink4")
job.commit()

上記のコードスニペットから、「ResolveChoice」の使用は何ですか? それは必須ですか？
このジョブを実行すると、宛先 (order_summary.csv) に新しいフォルダーとファイル (ランダムなファイル名) が作成され、S3 フォルダーにある order_summary_csv テーブル (CSV ファイル) に直接取り込むのではなく、データが取り込まれました。 . spark(Glue) が目的の CSV ファイルにデータを取り込むことは可能ですか?

amazon-web-services - Glue での ResolveChoice の使用

1 に答える 1

Related

Reference