に似た評価データセットにこれを実装しようとしNetflix
ていますが、「機能する」ようになりました。0
トレーニングエラーは、各反復/より多くの機能が追加された後に駆動されます。
これがテスト データセット (トレーニングに使用されなかった少数の評価を持つユーザー) をどの程度予測するかを判断するにはどうすればよいですか? ファンクはその部分を軽視していて、本当に混乱しています。
次のマトリックスから始めました。
- ユーザー機能マトリックス (Users x Num_Features)
- 映画の特徴マトリックス (映画 x Num_Features)
- 評価マトリックス (映画 x ユーザー)
最初の 2 つの行列を更新する唯一の方法は、アルゴリズムの反復ごとに更新することです。私はそれらのマトリックスを訓練することができず、その後完全に新しいユーザーを紹介し、彼の特徴マトリックスがどのように見えるかを推定することはできないと思います.
私が今試したのは、 から評価の 20% を削除しRating Matrix
、それらをテスト マトリックスに移動し、両方の空のセルをすべて 0 で埋めることです (コスト関数では無視されます)。動いていない。