IMDB データベースを使用して、最も評価が高く、特定の年に最も多くの映画に出演した俳優/女優を見つけています。俳優のデータセットを評価に参加させようとしています。次に、年をフィルター処理し、最高の評価と映画の数に基づいてデータを並べ替えます。
joinedActorRating = JOIN ratings by movie, actors BY movie;
actorRating = FOREACH joinedActorRating GENERATE *;
actorsYear = FILTER actorRating BY(year MATCHES '2000');
groupedYear = GROUP actorsYear BY (year,rating,firstName,lastName);
aggregatedYear = FOREACH groupedYear GENERATE group, COUNT (actorsYear) AS movieCount;
unaggregatedYear = FOREACH aggregatedYear GENERATE FLATTEN(group) AS (year,rating,firstName,lastName);
sortRating = ORDER unaggregatedYear BY rating ASC, count ASC;
dump sortRating;
コンパイラは、2 行目は「無効なフィールド プロジェクション」であると言いますが、2 つのデータセットを結合した後に年フィールドにアクセスする方法がわかりません。これを修正する方法を知っている人はいますか?