私は、300 万人のユーザーと 500,000 の製品を含むレコメンデーションの問題を扱っています。レコメンデーションの目的は、特定の製品にアクセスしたときに、特定のユーザーにさらに 5 ~ 10 個の製品をレコメンドすることです。
リアルタイムレコメンドエンジンの部分は完成しましたが、1~2秒でレコメンドするのはそう簡単ではないことがわかりました。次の 2 つの戦略を検討します。
推奨事項をオフラインでバッチ モードで実行し、結果をMySQL DB に保存します。ただし、テーブルのエントリ数は膨大な数のようです。各製品の各ユーザーは、少なくとも 5 ~ 10 個の推奨製品を保存する必要があります。テーブル属性としてユーザーと製品を使用してテーブルを作成すると、300 万 x 500,000 のエントリが存在します。
その場でおすすめを予測します。試してみましたが、応答時間が長すぎます。
この問題について誰か提案してもらえますか?