私は、通信会社向けのレコメンデーション エンジンの開発に関するケース スタディに取り組んでいます。目的は、適切な製品を新規顧客に推奨することです。私たちが従う予定のロジックは、彼のプロフィール (年齢、職業、性別など) を既存の顧客データベースと比較して、類似の顧客を見つけ、それらの顧客が最もよく使用する製品を推奨することです。サンプルデータは次のとおりです。
customerID gender SeniorCitizen Partner Dependents tenure PhoneService Contract Package
7590-VHVEG Female 0 Yes No 1 No Month-to-month Package1
5575-GNVDE Male 0 No No 34 Yes One year Package2
3668-QPYBK Male 0 No No 2 Yes Month-to-month Package1
コサイン類似度、ユークリッド距離、ピアソン相関係数など、多くの類似度測定手法に出会いましたが、自分の状況に合ったものを見つけることができませんでした。
始め方を教えてください。私はRでやろうと思っていますが、現時点ではコードを探していません。