クエリを実行していますが、HiveQL のサブクエリの概念に少し固執しています。私はHiveを初めて使用し、多くのことを読みましたが、まだ機能しません。
だから、私が興味を持っているフィールドを含む大きなテーブルがcreated_date
ありsize
ます。したがって、基本的には、特定の年に作成されたファイルのサイズの合計の集計を実行し、異なる年ごとにグループ化したいと考えています。
私の現在のクエリ:
SELECT year(created_date), SUM(size) FROM <tablename> GROUP BY created_date
2001 2654567
2001 231818
2001 1978222
2002 7625332
2002 6272829
2003 2733792
これにより、テーブル内のすべての年のリストと上記の各年の合計が得られますが、年の重複があり、ここでSELECT DISTINCT
年にサブクエリを実行し、合計も合計する必要がありsize
ます。
どんな助けでも素晴らしいです。