0

クエリを実行していますが、HiveQL のサブクエリの概念に少し固執しています。私はHiveを初めて使用し、多くのことを読みましたが、まだ機能しません。

だから、私が興味を持っているフィールドを含む大きなテーブルがcreated_dateありsizeます。したがって、基本的には、特定の年に作成されたファイルのサイズの合計の集計を実行し、異なる年ごとにグループ化したいと考えています。

私の現在のクエリ:

SELECT year(created_date), SUM(size) FROM <tablename> GROUP BY created_date

2001    2654567
2001    231818 
2001    1978222 
2002    7625332 
2002    6272829 
2003    2733792

これにより、テーブル内のすべての年のリストと上記の各年の合計が得られますが、年の重複があり、ここでSELECT DISTINCT年にサブクエリを実行し、合計も合計する必要がありsizeます。

どんな助けでも素晴らしいです。

4

1 に答える 1