FactorizationRecommender の予測機能について質問があります。
私が自由に使えるのは、ユーザー アイテムのペア (および各ペアのバイナリ評価) を含む大規模なデータセットです。ユーザーがすべてのアイテムを操作したわけではないことに注意してください (評価マトリックスは非常にまばらです)。
その後、データセットから 1 人のユーザー (私はそのユーザーをコールド ユーザーとして選択) のすべての評価を削除します。残りのすべてのユーザー アイテム ペアで、行列分解モデルをトレーニングします ( factorization_recommender.create(...,binary_target=True)
)。
ここで、コールド ユーザーの評価の一部をモデルに示すときに、コールド ユーザーの残りの評価を予測したいと思います (たとえば、コールド ユーザーの評価のモデル 10 を表示し、他のすべての評価の予測を計算したい)。アイテム)。次に、コールド ユーザーのみの予測の RMSE を計算したいと思います。
私の質問は 2 つあります。まず第一に、どの引数をFactorizationRecommender.predict
関数に渡せばよいか、完全にはわかりません。モデルに表示したいユーザー アイテム ペア (およびバイナリ評価) の割合 (たとえば、10 個の評価) new_observation_data
。そして、私の入力は何dataset
ですか?最初のトレーニング データセットは?
第二に、私の質問は、FactorizationRecommender.predict
機能が正確にどのように機能するか (バックグラウンドで何が起こっているか) です。初期トレーニング データセットに含まれていないユーザーをどのように予測できますか? 因数分解の潜在因子はこのユーザー用に構築されていないため、ユーザーの予測はどのように行われるのでしょうか?
GraphLab Create の現在のバージョンは v1.10.1 です。
ご協力いただきありがとうございます!