machine-learning - 評価なしの MLlib 項目ベースの協調フィルタリング

翻译自：https://stackoverflow.com/questions/37166701 2016-05-11T15:08:44.263

598 次

クエリログから推奨システムを構築しています。クエリログごとに、ユーザーがクリックしたリンクに関するデータがあります。ユーザーは、アクセスしたリンクに対して評価を提供しません。「これをクリックしたら、他の似たようなユーザーが試したこれを試してみてください」と提案するレコメンデーションシステムを作成しようとしています。私は Apache Spark - MLLib を調査して、目的のために協調フィルタリングを使用しています。残念ながら、ALS アルゴリズムは「評価」データを取ります。

これが私がオンラインで得た解決策の1つです：

「レコメンデーションが必要なページごとに、そのページを閲覧したすべてのユーザーを検索します。次に、それらのユーザーごとに、閲覧した他のすべてのページを検索します。次に、各ページを閲覧したユーザーの数を数えます。このデータセットのページに移動し、カウントが最も高いものを推奨事項として使用してください。」

ユーザーは、このアプローチが遅いことを示唆しています。

ランキングデータを「偽造」する良い方法があるかどうか、またはランキングデータを必要としない一般的なオープンソースの実装があるかどうか疑問に思っていました。

machine-learning - 評価なしの MLlib 項目ベースの協調フィルタリング

1 に答える 1

Related

Reference