0

ユーザーが 1 から 5 のスケールでいくつかの映画に投票するとします。これらの映画にはジャンル情報があり、映画には複数のジャンルが含まれる場合があります。このような:

Movie A Rating 4
Action/Sci-Fi

Movie B Rating 5
Comedy/Action

Movie C Rating 4
Comedy/Drama

ユーザーが好きなジャンルを知りたい。ここに結果セットがあります。

Genre Movie_Count Average_Rating

----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4

明らかに、このような小さな結果セットでは何も予測できませんが、より大きなデータセットがあると仮定しましょう。

このデータを使用して、このユーザーの最も好きなジャンルをどのように並べ替えることができますか? 加重平均を計算するだけですか、それとももっと複雑ですか?

4

1 に答える 1

1

ここで私が目にする主な問題は次のとおりです。

ユーザーが 1000 本のコメディー映画を評価し、平均スコアは 4 です

ユーザーは 10 本のアクション映画を評価し、平均スコアは 4.1 です

どのように注文しますか?

議論と考えられる解決策の 1 つについては、 http://www.evanmiller.org/how-not-to-sort-by-average-rating.htmlを参照してください。

別の問題は次のとおりです。

映画がコメディとアクションの両方であり、4.0 の評価が与えられた場合、それがコメディまたはアクションであるため、それはいくらでしたか?

これは、期待値の最大化http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithmを使用して解決できます。

于 2012-02-07T00:27:37.757 に答える