私は Graphlab の item_similarity_recommender を使用していますが、predict() 関数は、評価が 1 から 5 の間であっても、ほとんどの予測項目にゼロを割り当てていることに気付きました。もちろん、これは非常に高い RMSE を持つことになります。
item_similarity_recommender は KNN に基づいているため、予測される評価は 1 ~ 5 になるはずです。なぜこれが起こっているのか誰にも説明できますか??
コードは単純に次のとおりです。
train, test = graphlab.recommender.util.random_split_by_user(dataset, max_num_users=1000)
m = graphlab.recommender.item_similarity_recommender.create(train, target='target', only_top_k=65)
rmse=m.evaluate_rmse(test, target='target')
print(m.predict(test))