3

映画・アイテムのおすすめみたいなことを言っているのですが、不動産の方がややこしいようです。Web サイトにアクセスして RE を検索すると、ユーザーにいくつかの提案が表示されます。タスクを 2 つのタスクに分けましょう。

a) ユーザーはまだ個人情報を入力していません - アイテムベースの推奨事項 b) ユーザーはすでに収入、場所などの詳細を入力しています - アイテム/ユーザーベースの推奨事項

タスク a) で最初に頭に浮かぶのは、RE フィーチャのモデリングを開始することですが、正確な値ではなく、いくつかの範囲を使用します。例えば:

  1. 面積(m2)

    • 40 - 50 「1」のマークを付けることができます
    • 50~70は「2」
    • など...
  2. 価格:

    • 20 - 30千€は1としてマークされます
    • 30 - 40 は 2 になります
    • など...
  3. 市内中心部への近さ:

    • REが市内中心部にある場合は1
    • ゾーン 2 の場合は 2、または中心から 2/3 キロメートルまで
    • ゾーン 3 の場合は 3、または中心から 7 km

したがって、範囲を持つことで、ベクトルを各 RE プロパティに割り当てることができます。これにより、ユークリッド距離、ピアソン相関、いくつかの最近傍アルゴリズムを使用できるようになります。

私のアプローチについてコメントするか、新しいアプローチを提案してください。

4

1 に答える 1

4

すでに十分なトラフィックのある Web サイトがある場合は、純粋な協調フィルタリング アプローチを試すことができます。つまり、このプロパティを見た人は、これらの他のプロパティも見ました。そこでピアソン相関を使用すると、良い結果が得られます。

2 つの RE 間の類似性は、次のように定義できます。

      RE1とRE2の両方を見た人の数
シム = ----------------------------------------------
      どちらかまたは両方を見た人の数

ユーザーがプロパティ RE を表示している場合、表示されているプロパティとの類似性スコアに基づいて他のすべての RE プロパティを並べ替え、上位のいくつかを表示できます。

この上に、プロパティの場所、価格帯などの明らかなフィルターを追加できます。

また、提案したように類似性を定義し、両方の結果を混合して、純粋な協調フィルタリング アルゴリズムを使用した場合に入る可能性が高くない新しい RE エントリから適切に表現することもできます。

于 2011-05-14T06:11:52.773 に答える