フォームのファイルの場合
A B user1
C D user2
A D user3
A D user1
フィールド3の個別の値の数を計算したいcount(distinct(user1, user2,user2,user1)) = 3
次の豚のスクリプトを使用してこれを行っています
A = load 'myTestData' using PigStorage('\t') as (a1,a2,a3);
user_list = foreach A GENERATE $2;
unique_users = DISTINCT user_list;
unique_users_group = GROUP unique_users ALL;
uu_count = FOREACH unique_users_group GENERATE COUNT(unique_users);
store uu_count into 'output';
フィールドの個別の値の数を取得するより良い方法はありますか?