視聴した映画について次の評価を持つ次のユーザーがいるとします。
User1 Movie1-5 Movie2-4
User2 Movie2-5 Movie2-3 Movie3-4
User3 Movie1-4 Movie2-4 Movie4-4
共同フィルタリングを使用して、ユーザー 1 に映画 3 を提案する方法と、ユーザー 1 が映画 3 に 4 以上を与える確率を計算する方法を教えてください。
視聴した映画について次の評価を持つ次のユーザーがいるとします。
User1 Movie1-5 Movie2-4
User2 Movie2-5 Movie2-3 Movie3-4
User3 Movie1-4 Movie2-4 Movie4-4
共同フィルタリングを使用して、ユーザー 1 に映画 3 を提案する方法と、ユーザー 1 が映画 3 に 4 以上を与える確率を計算する方法を教えてください。
協調フィルタリングを使用してレコメンデーションを生成する方法はいくつかあります。ここでは、ユーザー ベースおよびアイテム ベースの協調フィルタリングの方法について説明します。これらの方法は、推奨アルゴリズムで最もよく使用されます。
ユーザーベースの協調フィルタリング
これは基本的にユーザー間の類似度を計算します。類似度は、ピアソン相関またはコサイン類似度です。より多くの相関数がありますが、それらが最も使用されています。この記事では、これを計算する方法について説明しています。
ユーザーベースのフィルタリングにはいくつかの課題があります。1 つ目は、データの希薄性の問題です。これは、レビューが少ない映画がたくさんある場合に発生します。これにより、ユーザー間の相関関係を計算することが難しくなります。このウィキペディアのページでは、これについて詳しく説明しています。
2 つ目は、スケーラビリティの問題です。数千の映画を持つ数百万のユーザーがいる場合、ユーザー間の相関を計算するパフォーマンスは大幅に低下します。
項目ベースの協調フィルタリング
この方法は、ユーザーではなく映画間の類似度を計算するため、ユーザーベースのフィルタリングとは異なります。この類似性を使用して、ユーザーの評価を予測できます。このプレゼンテーションはそれを非常によく説明していることがわかりました。
アイテムベースのフィルターはユーザーベースのフィルターよりも優れていますが、同じ問題に悩まされていますが、少し小さくなっています.
コンテンツ ベースのフィルタリング
データを見ると、ユーザーからのデータが少なすぎるため、レコメンデーションを生成するのが難しくなります。協調フィルタリング方法を使用するのに十分なデータが得られるまで、コンテンツ ベースのフィルターを使用することをお勧めします。これは基本的にユーザーのプロフィールを見て、それを映画の特定のタグと比較する非常に単純な方法です。このページでは、より詳しく説明しています。
これがあなたの質問のいくつかに答えることを願っています!