1

視聴した映画について次の評価を持つ次のユーザーがいるとします。

User1 Movie1-5 Movie2-4 
User2 Movie2-5 Movie2-3 Movie3-4
User3 Movie1-4 Movie2-4 Movie4-4

共同フィルタリングを使用して、ユーザー 1 に映画 3 を提案する方法と、ユーザー 1 が映画 3 に 4 以上を与える確率を計算する方法を教えてください。

4

1 に答える 1

4

協調フィルタリングを使用してレコメンデーションを生成する方法はいくつかあります。ここでは、ユーザー ベースおよびアイテム ベースの協調フィルタリングの方法について説明します。これらの方法は、推奨アルゴリズムで最もよく使用されます。

ユーザーベースの協調フィルタリング

これは基本的にユーザー間の類似度を計算します。類似度は、ピアソン相関またはコサイン類似度です。より多くの相関数がありますが、それらが最も使用されています。この記事では、これを計算する方法について説明しています。

ユーザーベースのフィルタリングにはいくつかの課題があります。1 つ目は、データの希薄性の問題です。これは、レビューが少ない映画がたくさんある場合に発生します。これにより、ユーザー間の相関関係を計算することが難しくなります。このウィキペディアのページでは、これについて詳しく説明しています。

2 つ目は、スケーラビリティの問題です。数千の映画を持つ数百万のユーザーがいる場合、ユーザー間の相関を計算するパフォーマンスは大幅に低下します。

項目ベースの協調フィルタリング

この方法は、ユーザーではなく映画間の類似度を計算するため、ユーザーベースのフィルタリングとは異なります。この類似性を使用して、ユーザーの評価を予測できます。このプレゼンテーションはそれを非常によく説明していることがわかりました。

アイテムベースのフィルターはユーザーベースのフィルターよりも優れていますが、同じ問題に悩まされていますが、少し小さくなっています.

コンテンツ ベースのフィルタリング

データを見ると、ユーザーからのデータが少なすぎるため、レコメンデーションを生成するのが難しくなります。協調フィルタリング方法を使用するのに十分なデータが得られるまで、コンテンツ ベースのフィルターを使用することをお勧めします。これは基本的にユーザーのプロフィールを見て、それを映画の特定のタグと比較する非常に単純な方法です。このページでは、より詳しく説明しています。

これがあなたの質問のいくつかに答えることを願っています!

于 2016-11-07T10:21:41.200 に答える