問題タブ [aws-glue]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2950 問題

0 投票する

0 に答える

814 参照

amazon-s3 - AWS Glue で圧縮 (tar ファイル) を処理する方法

「myarchive_1.tar.gz」という名前の tarfile が amazon s3 にあり、AWS Glue を介して amazon s3 自体で抽出したいと考えています。

これは、AWS Glue で実行しているサンプルコードです。

しかし、aws グルーで実行しているときはいつでも、次のエラーが発生します

この問題を解決するのを手伝ってください。

前もって感謝します、

ヨギタ。

amazon-s3 aws-glue

2017-12-05T09:14:31.200

0 投票する

2 に答える

2761 参照

apache-spark - AWS Glue の単純な ETL ジョブで「ファイルは既に存在します」と表示される

いくつかの ETL を使用して、ビッグデータプロジェクトの AWS Glue を評価しています。S3 から CSV ファイルを正しく取得するクローラーを追加しました。最初は、その CSV を JSON に変換し、そのファイルを別の S3 の場所 (同じバケット、別のパス) にドロップするだけです。

AWS が提供するスクリプトを使用しました (ここではカスタムスクリプトは使用しません)。そして、すべての列をマップしました。

ターゲットフォルダは空ですが (ジョブが作成されたばかりです)、ジョブは「ファイルが既に存在します」で失敗します: ここにスナップショット。ジョブを開始する前に、出力をドロップするふりをした S3 の場所は空でした。ただし、エラーの後に 2 つのファイルが表示されますが、それらは部分的なもののようです: スナップショット

何が起こっているのかについてのアイデアはありますか?

完全なスタックは次のとおりです。

apache-spark aws-glue

2017-12-12T19:58:32.377

1 2 3 4 5 6 7 8 9 10

問題タブ [aws-glue]

amazon-s3 - AWS Glue で圧縮 (tar ファイル) を処理する方法

apache-spark - AWS Glue の単純な ETL ジョブで「ファイルは既に存在します」と表示される

Reference