0

ある S3 バケットから別のバケットにデータを取り込む小さなグルー ジョブを作成できましたが、コードの最後の数行については明確ではありません (以下)。

applymapping1 = ApplyMapping.apply(frame = datasource_lk, mappings = [("row_id", "bigint", "row_id", "bigint"), ("Quantity", "long", "Quantity", "long"),("Category", "string", "Category", "string") ], transformation_ctx = "applymapping1")

selectfields2 = SelectFields.apply(frame = applymapping1, paths = ["row_id", "Quantity", "Category"], transformation_ctx = "selectfields2")

resolvechoice3 = ResolveChoice.apply(frame = selectfields2, choice = "MATCH_CATALOG", database = "mydb", table_name = "order_summary_csv", transformation_ctx = "resolvechoice3")

datasink4 = glueContext.write_dynamic_frame.from_catalog(frame = resolvechoice3, database = "mydb", table_name = "order_summary_csv", transformation_ctx = "datasink4")
job.commit()
  1. 上記のコード スニペットから、「ResolveChoice」の使用は何ですか? それは必須ですか?
  2. このジョブを実行すると、宛先 (order_summary.csv) に新しいフォルダーとファイル (ランダムなファイル名) が作成され、S3 フォルダーにある order_summary_csv テーブル (CSV ファイル) に直接取り込むのではなく、データが取り込まれました。 . spark(Glue) が目的の CSV ファイルにデータを取り込むことは可能ですか?
4

1 に答える 1