これは主に検索の問題のように聞こえますが、推奨の問題ではありません。主に、タグに基づいて検索結果を並べ替えてフィルタリングします。そのため、Luceneは一般的に、Mahoutではなく、デプロイするためのツールだと思います。(Mahout分類子を使用してタグを学習することは非常に正しいですが。)
これをレコメンダーの問題として本当に想像したいのなら、あなたのアイテムはタグだと言うかもしれません。X、Y、Zのタグが付いたページを表示するなど、タグを操作するときはいつでも、「アイテム」X、Y、Zにもう少し興味があることを示します。ここでの推奨事項は、次の新しいタグを提案することです。興味。
タグとの相互作用の単純なカウントを数値の「評価」として使用してみることができますが、それはレコメンダーのコンテキストでは素晴らしい結果をもたらさないと思います。カウントのログを使用する方が良いですが、それでも間違っていると感じます。インタラクションカウントを無視して、ユーザーとタグがインタラクションしたことがあるかどうかを使用することができます-「ブール設定」。
私が知っているこの入力に最もよく一致する推奨アルゴリズムモデルは、ParallelALSFactorizationJobに表示される交互最小二乗モデルです。それがあなたに使えるかどうかはわかりませんが、それはあなたが時間と傾向を持っているかどうかを調査するアルゴリズムです。その入力は、評価ではなく「相互作用の強さ」のようなものであり、そのように扱われます。これが、ここにあるものです。