問題タブ [aws-glue-data-catalog]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - AWS グルーのデータカテゴリには何が含まれていますか?
経由でデータをデータ カタログにクロールする作業を行っていますaws glue
。しかし、データベースの定義について少し混乱しています。aws docで見つけたものから、A database in the AWS Glue Data Catalog is a container that holds tables. You use databases to organize your tables into separate categories.
. データベースには正確に何が含まれているのだろうか。他のデータ ソースからすべてのデータを読み込み、カタログを作成しますか? それとも、カタログのみが含まれていますか? グルー データベースのテーブルのサイズを知るにはどうすればよいですか? そして、どのタイプのデータベースを使用しますnosql
かrds
?
たとえば、データをロードするクローラーをs3
作成し、 でカタログ テーブルを作成しますglue
。glue
テーブルには からのすべてのデータが含まれていますs3 bucket
か? バケットを削除するs3
と、クローラーによって作成されたカタログ テーブルに対して実行されるglueの他のジョブに影響がありますか?
カタログ テーブルにデータ スキーマのみが含まれている場合、データ ソースが変更された場合にデータを更新し続けるにはどうすればよいですか?
amazon-web-services - グルー クローラーの実行統計を監視するにはどうすればよいですか?
私はAWS Glue
データETLを行うために使用しています。glue crawler
AWS で実行統計を監視する方法が見つかりませんでした。このドキュメントのようなグルージョブを監視する方法を知っています: https://docs.aws.amazon.com/glue/latest/dg/monitoring-awsglue-with-cloudwatch-metrics.html。glue crawler
しかし、実行を確認する同様の方法があるのだろうか?
クローラーのログを確認できますが、Cloudwatch
あまり読みにくいです。指定された期間中に何回の呼び出しが発生したかを把握するのは困難です。