特定の属性と顧客タイプを持つ顧客データベースがあります。属性のコレクションはさまざまです(ただし、それらは有限のセットからのものです)。特定の属性を持つ不明なタイプの新しい顧客を見るとき、その顧客がどのタイプに属しているかを判断したいと思います。たとえば、これらの顧客がすでにDBにいるとします。
Customer | Type | Attributes
1 A 44,32,5,'X'
2 A 3,32,66,'A'
3 B 6,32,'A', 'B'
4 C 47,31,2,'H'
5 C 14,32,2,'O'
6 C 2,'C'
7 A 44
たとえば、3,32,2などの属性を持つ新しい顧客を受け取った場合、この顧客がどのタイプに属しているかを判断したいと思います。コードは、この一致の信頼度(パーセンテージ)を報告する必要があります。
ここで使用するのに最適な方法は何ですか?何か統計的なもの、またはある種のアフィニティマトリックスに基づく方法、またはレコメンデーションエンジンスタイルのピアソン相関係数ベースのアプローチ?サンプルの疑似コードは大歓迎ですが、いずれにしても、すべてのアイデアは問題ありません。
ありがとう、