0

私は、ユーザーが推奨/いいね(記事、サイトなど)の「リスト」を送信できるサービスを構築しています。システムは、ユーザーが好きな他のリンクのリストも表示します。

このプロセスを実行するための私の心の唯一のアイデアは次のとおりです。

  1. ユーザーAは、リンクのリストを送信します(例:10リンク)
  2. システムは、ユーザーAとユーザーBのリンク間で80%同じリンクを持つ他のユーザー(たとえばユーザーB)のリストを検索します
  3. (ユーザーBリストからの)20%の新しいリンクをユーザーAに表示する

これを行う他の方法はありますか?または、同じことを行うオープンソースプロジェクトはありますか?

どんな言語でも大丈夫ですが、私はPerl、PHP、Java、SQLにもっと興味があります

4

2 に答える 2

1

あなたのアプローチは簡単に実装できます。しかし、私が読んでいるように、あなたはリンクではなくユーザーをペアリングしています。80%以内に一致するものが見つからない場合はどうなりますか?

より良いアプローチは、ノードとしてのリンクと接続の「類似度」スコアを使用してグラフを作成することだと思います。各2つのリンクが同じリストに表示される回数に基づいてスコアを計算します。

ユーザーAに推奨を行う場合は、ユーザーAのリストにまだ含まれていない各リンクについて、スコアが最も高いリンクを取得します。

于 2011-07-31T06:02:56.267 に答える
0

まったく同じリンクを持つことはほとんどないと思います。より良いアプローチは、各リンクをダウンロードして単語インデックスを作成し、リンクではなくコンテンツを一致させることです。ウェブ検索のように:)

于 2011-12-01T23:45:46.523 に答える