1

MySQLの協調フィルタリングを参照することによって?、私は次のものを作成しました:

CREATE TABLE `ub` (
  `user_id` int(11) NOT NULL,
  `book_id` varchar(10) NOT NULL,
  `rate` int(11) NOT NULL,
  PRIMARY KEY (`user_id`,`book_id`),
  UNIQUE KEY `book_id` (`book_id`,`user_id`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1;

insert into ub values (1, 'A', '8'), (1, 'B', '7'), (1, 'C', '10');
insert into ub values (2, 'A', '8'), (2, 'B', '7'), (2, 'C', '10'), (2,'D', '8'), (2,'X', '7');
insert into ub values (3, 'X', '10'), (3, 'Y', '8'), (3, 'C', '10'), (3,'Z', '10');
insert into ub values (4, 'W', '8'), (4, 'Q', '8'), (4, 'C', '10'), (4,'Z', '8');

そうすれば、次の表を取得して、それがどのように機能するかを理解できます。

create temporary table ub_rank as 
select similar.user_id,count(*) rank
from ub target 
join ub similar on target.book_id= similar.book_id and target.user_id != similar.user_id and target.rate= similar.rate
where target.user_id = 1
group by similar.user_id;

select * from ub_rank;

+---------+------+
| user_id | rank |
+---------+------+
|       2 |    3 |
|       3 |    1 |
|       4 |    1 |
+---------+------+

しかし、次のコードの後で混乱し始めます。

select similar.rate, similar.book_id, sum(ub_rank.rank) total_rank
from ub_rank
join ub similar on ub_rank.user_id = similar.user_id 
left join ub target on target.user_id = 1 and target.book_id = similar.book_id and target.Rate= similar.Rate 
where target.book_id is null
group by similar.book_id
order by total_rank desc, rate desc;

+---------+------------+
| book_id | total_rank |
+---------+------------+
| X       |          4 |
| D       |          3 |
| Z       |          2 |
| Y       |          1 |
| Q       |          1 |
| W       |          1 |
+---------+------------+

(解決済み)まず、XとDの合計ランクが同じではない(つまり3)のではないかと思います。ユーザーBのユーザーAと同じ本の数を数えませんか?だから、DとXは3でなければなりませんか?!

(解決済み)次に、レートなどのコードをどのように変更すれば、ランキングの要素として機能することができますか。つまり、2冊の本のランクが同じである場合、マークの高い方がランクが高くなります。

ありがとう

編集済み

(1、'A'、 '8')、(1、'B'、 '7')、(1、'C'、 '10');

(2、'A'、 '8')、(2、'B'、 '7')、(2、'C'、 '10')、(2、'D'、 '8')、(2 、'X'、 '7');

私がやりたいのは、ユーザー1と2の動作が似ていると仮定することです(前にA、B、Cを選択し、評価が一致している)。したがって、ユーザーAの方がレートが高いのでDをお勧めします。

上記のコードはそうしないようですか?として、最初にランク付けされたのはXです。

4

1 に答える 1

1

まず、XとDの合計ランクが同じではないのはなぜだろうか(つまり3)。ユーザーBのユーザーAと同じ本の数を数えませんか?だから、DとXは3でなければなりませんか?!

user_idXは、2番目と3番目の存在としてより大きなランクを持ちuser_id、クエリはランクの合計を取得します。この場合は3 (user_id = 2) + 1 (user_id = 3)

次に、レートなどのコードをどのように変更すれば、ランキングの要素として機能することができますか。つまり、2冊の本のランクが同じである場合、マークの高い方がランクが高くなります。

同じクエリを使用して、ランクの後にレートdescで並べ替えます。

select similar.book_id, sum(ub_rank.rank) total_rank
from ub_rank
join ub similar on ub_rank.user_id = similar.user_id 
left join ub target on target.user_id = 1 and target.book_id = similar.book_id and target.Rate= similar.Rate 
where target.book_id is null
group by similar.book_id
order by total_rank desc, rate desc;

更新:要件に応じて、他のユーザーと最も一致し、最高価格の書籍のリストを取得する必要があります。同じものについて、以下のクエリを試してください。

SELECT
    temp.book_id,
    temp.rate as book_rate
FROM (
        SELECT 
            similar.user_id, 
            COUNT( similar.book_id ) as book_match_count
        FROM 
            ub target
            JOIN ub similar ON  target.book_id= similar.book_id AND target.user_id != similar.user_id
        WHERE 
            target.user_id = 1
        GROUP BY 
            similar.user_id
    ) AS users_with_book_matches
JOIN ub temp ON ( temp.user_id =users_with_book_matches.user_id AND temp.book_id NOT IN ( SELECT book_id FROM ub WHERE ub.user_id = 1 ) ) 
GROUP BY
    temp.book_id
ORDER BY 
    users_with_book_matches.book_match_count DESC,
    temp.rate DESC
limit 5

上記のクエリは、上位5つの最も近い本の一致を取得します

これがSqlFiddleです。必ずuser_id2か所で変更してください。これが目的に役立つことを願っています。

于 2013-03-26T02:58:20.333 に答える