私はスパークするのが初めてです。モンゴには約15 TBのデータがあります
ApplicationName Name IPCategory Success Fail CreatedDate
abc a.com cd 3 1 25-12-2015 00:00:00
def d.com ty 2 2 25-12-2015 01:20:00
abc b.com cd 5 0 01-01-2015 06:40:40
ApplicationName、groupby (Name,IpCategory) に基づいて 1 週間のデータを探しています。mongo からデータを取得し、出力を mongo に保存できます。私はJavaを使用してそれに取り組んでいます。
注:- 1 か月のデータから、先週だけ必要です。groupby(Name,IPCategory) である必要があります。