私はPHPベースのショッピングアプリケーションに取り組んでいます。同じ製品を表すことがわかっている文字列のリストがあります。これらの文字列には、完全な製品名またはその一部が含まれている可能性があります(完全な製品名は通常、ブランド+モデルです)。
この製品名の抽出を実行するための最良のアプローチは何でしょうか。
たとえば、同じ製品を表す文字列のリストは次のとおりです。
- Tkg BOUILLOIRE TKG-JK 1008 RWD
- Tkg Jk 1008 Rwd
- Tkg Kalorik-JK1008RWD-BouilloireÉlectriquesansFil360°
- TKGBouilloireélectriquesansfil1.7リットル2000ワットPoisTKGRouge et blanc
- Tkg Kalorik-JK1008RWD-BouilloireÉlectriquesansFil360°
- Tkg JK 1008 RWD BOUILLOIRES
商品名「TkgJK1008RWD」を抽出する予定です。文字列4には部分的な情報しか含まれていないことに注意してください。
すべての文字列で繰り返される単語を数えたときに、アプローチを試しました。しかし、そこから先に進むのは難しい。
手がかりはありますか?
乾杯ニコラス