event1 foo_id1
event1 foo_id2
event1 foo_id4
event1 foo_id6
event1 foo_id7
event1 foo_id8
event1 foo_id8
event1 foo_id1
event1 foo_id4
event2 foo_id1
event2 foo_id2
event2 foo_id3
event2 foo_id4
event2 foo_id5
event2 foo_id6
event2 foo_id8
event2 foo_id9
event2 foo_id11
上記の情報は、特定のバケット (たとえばs3://hadoop.mycompany.com/bucket1/foo1.txt
) の下の S3 のファイルとして利用できます。
すべてのイベントにはfoo_ids
. " " のすべてのイベントについて、それらが で何回発生したevent2
かを知りたいです。foo_id
event1
たとえば、上記の場合、
foo_id1=2
foo_id2=1
foo_id3=0
foo_id4=2
foo_id5=0
foo_id6=1
foo_id8=2
foo_id9=0
foo_id11=0
予想される形式でデータを返すハイブ スクリプトを作成する方法は?