amazon-s3 - Apache アトラスと AWS S3

翻译自：https://stackoverflow.com/questions/65281368 2020-12-13T22:30:25.067

481 次

私は、AWS S3 に科学データをデータレイクの開始用の生データとして保存する必要があるプロジェクトに取り組んでいます。アプリケーションデータの JSON を計画し、S3 メタデータを使用してアプリケーションメタデータ (JSON スキーマ) を保持し、メタデータを処理します。現時点では、S3 サイトで AWS クラウドから利用できる唯一のサービスです。

クライアントは、生データをファイルとして取得できるパブリッシュ環境を望んでいます。カスタムカタログとセキュリティインフラストラクチャの構築は避けたいと考えています。

AWS S3 に直接接続する Apache Atlas について何も表示されません。しかし、AWS S3 の上に Apache Hive を配置し、その上に Apache Atlas と Ranger を配置することができます。しかし、これが S3 から生データを公開できる方法なのか、それとも Hive がより処理環境であるため機能するのかはわかりません。

AWS S3 上で Apache Atlas と Ranger を直接使用することは可能ですか?

amazon-s3 - Apache アトラスと AWS S3

0 に答える 0

Related

Reference