最近、研究で R の recommenderlab パッケージを使い始めました。
これはrecommenderlab
ドキュメントです:
http://cran.r-project.org/web/packages/recommenderlab/vignettes/recommenderlab.pdf
このドキュメントにはいくつかの例がありますが、大きな質問があります。
まず、recommenderlab パッケージと Jester5k データ セットを読み込みます。
library("recommenderlab") data(Jester5k)
Jester5k の最前線 1000 レコード (ユーザー) を使用して学習します。推奨アルゴリズムは POPULAR です。
r <- Recommender(Jester5k[1:1000], method="POPULAR")
次に、1001 番目のユーザーのおすすめリストを予測します。上位5項目を挙げてください。
recom <- predict(r, Jester5k[1001], n=5)<br/> as(recom, "matrix")
出力:
[1] "j89" "j72" "j47" "j93" "j76"<br/>
次に、上記の 5 項目の評価を確認します。
rating <- predict(r, Jester5k[1001], type="ratings")<br/> as(rating, "matrix")[,c("j89", "j72", "j47", "j93", "j76")]
出力:
j89 j72 j47 j93 j76<br/>
2.6476613 2.1273894 0.5867006 1.2997065 1.2956333<br/>
トップ5リストはなぜか「j89」「j72」「j47」「j93」「j76」なのですが、j47の評価はわずか0.5867006。
理解できません。
recommenderlab
の各アイテムの評価はどのように計算されratingMatrix
ますか?
また、TopN リストはどのように生成されるのでしょうか?