6

ある程度の成功を収めた製品を推奨するアルゴリズムを実装したので、現在、このアルゴリズムの初期入力データを計算する方法を検討しています。

私の目的は、ユーザーが何らかの履歴を持っている各製品のスコアを計算することです。

私が現在収集しているデータ:

  • ユーザー注文履歴
  • 匿名ユーザーと登録ユーザーの両方の製品ページビュー履歴

このデータはすべてタイムスタンプが付けられます。

私が探しているもの

私が提案を探していることがいくつかあります。理想的には、この質問は、単一の「正しい」答えを目指すのではなく、議論のためにもっと扱われるべきです。

  • 製品への関心を直接示唆する可能性のある、ユーザーのために収集できる追加データ
  • このデータを各製品のスコアに変換するためのアルゴリズム/方程式

私が探していないもの

この質問が間違った種類の回答で狂わされるのを避けるために、各ユーザーのこのデータを取得したら、次のようにします。

  • 距離スコアのピアソン係数を使用して、k-meansクラスタリングアルゴリズムを使用して多数のユーザークラスター(現時点では21)を生成します
  • 各ユーザー(オンデマンド)について、クラスター内で最も類似しているユーザーと最も類似していないユーザーを探し、任意の深さで繰り返すことにより、類似ユーザーのグラフを計算します。
  • ユーザーのグラフ内の他のユーザーの好みに基づいて、各製品のスコアを計算する
  • スコアを並べ替えて推奨事項のリストを返す

基本的に、入力データを取得したらどうするかについてのアイデアは探していません(後でさらにサポートが必要になる場合がありますが、この質問のポイントではありません)。この入力データを生成する方法についてのアイデアだけです。そもそも

4

2 に答える 2

2

これは、応答の干し草メーカーです。

  • 商品を見る時間
  • 製品について残されたコメントの意味解釈
  • 製品、ブランド、または製品カテゴリに関するディスカッション ページを作成し、コメントを意味的に解釈する
  • 製品ページを共有した場合 (メール、del.icio.us など)
  • ブラウザ (モバイルはラップトップに比べてページに費やす時間を減らし、大きな関心を示している可能性があります) と接続速度 (ページに費やした時間の量に影響します)
  • Facebookのプロフィールの類似性
  • ヒートマップ データ (例えば、kissmetrics 風)

どのような製品を販売していますか? これにより、より適切な回答が得られる場合があります。(これは古い質問なので、@Andrew Ingram と、同じ質問を持ち、検索でこのスレッドを見つけた他の人の両方に対処しています。)

于 2011-03-14T06:16:33.530 に答える
1
  1. ネットフリックスがユーザーに星の割り当てを許可する方法と同様に、ユーザーが自分の好みを明示的に述べることができるようにすることができます。
  2. 購入履歴があると言うので、彼らが購入したすべてのものに正の数値を割り当てることができます。購入しなかったものにはゼロを割り当てる
  3. 彼らが購入したものに対して、人気のあるものを調整して、ある種の加重値を設定できます。(ほぼ全員が製品を購入したとしても、その人がそれを購入したことにはあまり影響しません) 「用語の頻度 - 逆ドキュメントの頻度」を参照してください。
  4. ユーザーが見たが購入しなかったアイテムに、より小さな数値を割り当てることもできます。
于 2009-08-07T17:58:06.243 に答える