私はHiveを初めて使用し、スキーマが次のようなテーブルを持っています:
Name, Count, Timestamp
EMR ジョブをトリガーし、間隔と開始/終了エポックを指定して名前ごとのカウントのリストを抽出/集計するクエリを作成できるかどうかを知りたいです。
例えば
表の内容:
NameA, 1, 10000
NameA, 1, 2
NameA, 1, 1
NameB, 1, 500
NameB, 1, 1
パラメータ:
Interval: 1000ms
Start: 0
End: 10000
出力:
NameA, [2,0,0,0,0,0,0,0,0,1]
NameB, [2,0,0,0,0,0,0,0,0,0]