私はデータ レイクを理解しようとしていますが、ほとんどの例は単純なユース ケースのみを示しています。私が理解したいのは、事実上「結合クエリ」です。
たとえば、製品データ (S3-Product-Data にアップロード) を含むファイルと、製品の年間売上 (S3-Product-Sales にアップロード) を含むデータベースがあります。AWS Lakes / Athena は、これら 2 つの環境で実行されるクエリをどのように作成しますか?
もちろん、それらをリンクする何かが必要になります。クエリがどのように見えるか、また、Athena がデータをマージする (そしてパフォーマンスを向上させる) ために内部で何を行うのかはわかりません。