amazon-web-services - S3 バケットから AWS Glue に .tar ファイルをカタログ化する

翻译自：https://stackoverflow.com/questions/59849170 2020-01-21T21:01:43.423

58 次

AWS S3 バケットにファイル「v1.02_train.tar」(Lyft データセットhttps://level5.lyft.com/dataset/から) があります。AWS Glue データカタログに追加しようとしています。

AWS Glue クローラに .tar ファイルからスキーマを検出させるにはどうすればよいですか? ファイルを解凍するのをためらっています。これは、クローラーが各画像ファイルを個別にカタログ化して、何百万ものテーブルをデータカタログに追加するためです。さらに、S3 バケットのサイズが大きくなり、ストレージのコストが高くなります。

この一連のファイルを最適にカタログ化する方法のアイデアはありますか?

amazon-web-services - S3 バケットから AWS Glue に .tar ファイルをカタログ化する

0 に答える 0

Related

Reference