私は自分のウェブサイトに大量の製品を紹介しています。すでに DB にクロールした、さまざまな Web サイトから同様の製品をグループ化する必要があります。製品が検索されると、別の Web サイトからも同じ製品が表示されます。
私は次の方法を試しました
商品名によるグループ化
結果 - Sony Xperia Z、Sony Xperia Z( 黒 ) は同じ製品ですが、タイトルが異なるため、同じグループにはなれません。したがって、エラー率が非常に高くなります。
属性によるグループ化:
類似した属性と値を持つ製品は、1 つのグループに配置されます。しかし、非常に遅く、エラー率も高いです。さまざまな会社のさまざまな製品が同じ属性を持っている可能性があるためです。
これを行う最良の方法はどれですか。私を助けてください。
よろしくお願いします。下手な英語でごめんなさい。