0

顧客と彼が購入する製品のマッピングを含むデータセットがあります

c1->{P1, P2, p5} 
c2->{P3, P5, p4} 
c3->{P5, P2, p3}
....

それに基づいて、お客様に製品を推奨する必要があります。

cx の顧客の場合、製品を推奨する必要があるとします。これは、cx が上記のセットから何を購入しているかのデータがあり、アプリオリに実行して推奨事項を把握するためですが、大きなデータセットの場合は非常に遅いですか?

その問題を解決するための提案を誰か教えてくれませんか?

4

1 に答える 1

0

マーチャントが販売しているアイテムがトレーニング データであり、ランダムなアイテムがテスト データであると仮定します。したがって、販売する可能性が最も高いアイテムは、商人が現在販売しているアイテムの「機能」に依存します。「機能」とは、アイテムの価格、カテゴリを意味し、これらは詳細です。次に、アルゴリズムを決定するために、特徴空間を確認することをお勧めします。クラスターが小さい場合は、最近傍検索でもうまく機能します。分布が複雑な場合は、SVM を使用できます。さまざまなデータ視覚化手法があります。PCA を取得し、最初の 2 つの次元を視覚化することは、適切な選択です。

于 2013-03-01T18:15:21.820 に答える