ユーザーが 1 から 5 のスケールでいくつかの映画に投票するとします。これらの映画にはジャンル情報があり、映画には複数のジャンルが含まれる場合があります。このような:
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
ユーザーが好きなジャンルを知りたい。ここに結果セットがあります。
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
明らかに、このような小さな結果セットでは何も予測できませんが、より大きなデータセットがあると仮定しましょう。
このデータを使用して、このユーザーの最も好きなジャンルをどのように並べ替えることができますか? 加重平均を計算するだけですか、それとももっと複雑ですか?