問題タブ [aws-glue-data-catalog]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
249 参照

amazon-web-services - AWS グルーのデータカテゴリには何が含まれていますか?

経由でデータをデータ カタログにクロールする作業を行っていますaws glue。しかし、データベースの定義について少し混乱しています。aws docで見つけたものから、A database in the AWS Glue Data Catalog is a container that holds tables. You use databases to organize your tables into separate categories.. データベースには正確に何が含まれているのだろうか。他のデータ ソースからすべてのデータを読み込み、カタログを作成しますか? それとも、カタログのみが含まれていますか? グルー データベースのテーブルのサイズを知るにはどうすればよいですか? そして、どのタイプのデータベースを使用しますnosqlrds?

たとえば、データをロードするクローラーをs3作成し、 でカタログ テーブルを作成しますglueglueテーブルには からのすべてのデータが含まれていますs3 bucketか? バケットを削除するs3と、クローラーによって作成されたカタログ テーブルに対して実行されるglueの他のジョブに影響がありますか?

カタログ テーブルにデータ スキーマのみが含まれている場合、データ ソースが変更された場合にデータを更新し続けるにはどうすればよいですか?

0 投票する
1 に答える
1228 参照

amazon-web-services - グルー クローラーの実行統計を監視するにはどうすればよいですか?

私はAWS GlueデータETLを行うために使用しています。glue crawlerAWS で実行統計を監視する方法が見つかりませんでした。このドキュメントのようなグルージョブを監視する方法を知っています: https://docs.aws.amazon.com/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.htmlglue crawlerしかし、実行を確認する同様の方法があるのだろうか?

クローラーのログを確認できますが、Cloudwatchあまり読みにくいです。指定された期間中に何回の呼び出しが発生したかを把握するのは困難です。