1

古いレガシー販売システムに大量の製品説明データがあり、テキスト説明フィールドに含まれるモデル番号を推測して販売分析を実行しようとしています。

したがって、私の販売ラインは次のようになります。

LineitemID | Description
----
1 | Sony Headphones for a Sony DHJ232
2 | Sony DHJ232 in blue
3 | SANYO KI8767 with carry case

次に、すべての潜在的な製品範囲を含む別のテーブルを作成します。

ProductRange
----
Sony DHJ232
SANYO KI8767
Sony Headphones

すべての LineItems を返すクエリを作成し、どの ProductRange と結合するかを推測します。これは単純な JOIN および LIKE ステートメントで十分に単純です。2 つの異なる製品範囲が言及されている LineItem #1 のように、複雑な問題が発生します。これにより、複数の一致が発生し、そのうちの 1 つが正しくありません。

複数の一致が見つかったこの例では、文字列内の最初の一致が最も正しいと想定したいと思います。つまり、Sony DHJ232 ではなく、Sony ヘッドフォンです。

これに対する最善のアプローチについて誰かが提案できますか?

4

3 に答える 3