0

ユーザーにコンテンツを推薦するプロジェクトに取り組んでいます。各ユーザーからプロファイルを作成して、それらをクラスター化し、共通の推奨事項を提供できるようにしたいのですが、これらのユーザー間の類似性を測定できるようにする前に。ファジーラベルを使って記入できるアンケートを考えました。

私の質問は、この種の質問に答える2人のユーザーU1とU2の相関(類似性)をどのように測定できるかということです。

  • Q1。東京はいい街だと思います。U1:完全に同意する U2:部分的に同意する
  • Q2。DonQuixoteを読みました。U1:まったく同意しないU2:完全に同意する
  • ..。
  • Qn。タランティーノは良い映画監督だと思います。U1: 部分的に同意するU2:部分的に同意する

答えを数値に変換してから、ピアソン相関係数を計算してみようと思いました。しかし、それを行うためのよりエレガントな方法があるのだろうか。

4

1 に答える 1

2

(提供された回答からの)数値を1つの単一ベクトルに変換してから、コサイン類似度関数を適用すると便利です。コサイン類似度は、ピアソン相関係数よりも信頼性が高い (そして高速である) ことが証明されています。

ただし、これは小さな問題ではなく、実装は非常に困難になる可能性があります。

于 2012-11-05T15:01:40.683 に答える