1

次のコードは、私が計算しようとしているものを正確に返しません。ユニークユーザー数。何か案が?

data = LOAD 'input_initial' AS (user_id,item_id,rating,timestamp);
data = FOREACH data GENERATE user_id,item_id;
STORE data INTO 'input_final';
data_users = FOREACH data GENERATE user_id;
group_users = GROUP data_users BY user_id;
count_users = FOREACH group_users GENERATE COUNT(data_users);
STORE count_users INTO 'count_users';
4

1 に答える 1

3

個々のフィールドではなく「すべて」に作用するように、最終的な GROUP 操作を修正する必要があります。

group_users = GROUP data_users BY user_id;
grp_all = GROUP group_users ALL;
count_users = FOREACH grp_all GENERATE COUNT(group_users);
于 2013-02-06T11:55:08.083 に答える