市販品を分類する必要があります。あなたは価格比較エンジンが何をするか知っています。
特徴ベクトルを取得しました。彼らは最高ではありませんが、かなり良いです。私の最後のステップは、クラスターがいくつあるかを知らずにそれらを分類することです。したがって、k-meansのようなアルゴリズムは、クラスがいくつある必要があるため、機能しません。
したがって、ここでは特徴ベクトルのセットの例を示します。ここでは(例として)順番に並んでいますが、順序に依存しないアルゴリズムが必要です。
#################################################
47 - ddr2;asus;1066;g41;am;p5qpl;775;
48 - g41;p5qpl;asus;am;ddr2;vga;anakart;
49 - intel;anakart;ddr2;1066;p5qpl;asus;am;
50 - p5qpl;ddr2;asus;am;g41;vga;anakart;
51 - ddr2;asus;1066;g41;am;p5qpl;775;
52 - g41;p5qpl;1066;am;ddr2;asus;anakart;
53 - p5qpl;ddr2;1066;am;g41;asus;sata;
54 - g41;p5qpl;1066;am;asus;ddr2;sata;
###################################################
55 - engtx480;asus;384bit;2di;gddr5;vga;16x;
56 - 2di;karti;384bit;asus;engtx480;ekran;pci;
57 - asus;engtx480;2di;vga;gddr5;384bit;16x;
58 - 2di;karti;engtx480;384bit;asus;gddr5;1536mb;
59 - engtx480;asus;384bit;2di;gddr5;vga;16x;
60 - engtx480;asus;384bit;2di;gddr5;vga;16x;
####################################################
61 - ray;blu;ihbs112;siyah;bulk;dvd;sata;
62 - ihbs112;ray;blu;on;lite;yazici;kutusuz;
63 - ihbs112;blu;ray;lite;on;siyah;bulk;
64 - blu;ihbs112;ray;lite;on;siyah;yazici;
65 - liteon;ihbs112;bd;yazma;hizi;12x;max;
66 - ihbs112;ray;blu;on;lite;bulk;dvd;
67 - etau108;dvd;siyah;lite;on;rw;ihbs112;
68 - ihbs112;liteon;bd;yazma;hizi;12x;max;
69 - ihbs112;ray;blu;lite;on;siyah;bulk;
#####################################################
人間のように見える場合、これらの特徴ベクトルを使用するだけで製品を簡単に分類できます。しかし、私はアルゴリズムを介してそれを達成する必要があります。また、事前情報を必要とせず、特徴ベクトルを使用するだけのアルゴリズムでそれを実現する必要があります。
上記の特徴ベクトルセットから、47-54はクラスター、55-60は別のクラスター、61-69は別のクラスターです(各クラスターは実際の製品を意味します)。したがって、アルゴリズムは、これらの種類の特徴ベクトルを使用するだけで、これらを正しく分類する必要があります。
アルゴリズムは、特徴ベクトルの行の順序やクラスの数に依存することはできません。私たちは何も知りません、そして私たちはただ特徴ベクトルを持っています。
この分類問題についてのあなたの提案を待っています。ありがとうございました。