Pig を使用してアプリケーション ログを解析し、先月 (同じユーザーによって) 呼び出されなかったユーザーによって呼び出された公開メソッドを確認しています。
先月の前と先月の後にユーザーによってグループ化されたメソッドを呼び出すことができました:
BEFORE 先月関連サンプル
u1 {(m1),(m2)}
u2 {(m3),(m4)}
AFTER 先月関係サンプル
u1 {(m1),(m3)}
u2 {(m1),(m4)}
私が欲しいのは、ユーザーが、BEFORE にない AFTER にあるメソッドを見つけることです。つまり、
NEWLY_CALLED 期待される結果
u1 {(m3)}
u2 {(m1)}
質問: Pig でそれを行うにはどうすればよいですか? バッグを差し引くことはできますか?
DIFF 関数を試しましたが、予想される減算を実行しません。
よろしく、
ジョエル