0

注文番号、キャンセル日、理由を含むテーブルがあります。理由フィールドは varchar(255) フィールドであり、多くの異なる営業担当者によって書かれたものであり、キャンセル理由を分類するためにレポートを生成する必要がある理由カテゴリでグループ化するのが非常に困難です。TSQL で理由を分析する最良の方法は何ですか?

営業担当者が入力した理由のサンプル

cust already has this order going out
cust can not hold for item Called to cancel order
cust doesn't want to pay for shipping
wife ordered same item from different vendor, sent email
cst made a duplicate order, sent email
cst can't hold
Cust doesn't want to go through verification process so is cancelling order
doesn't ant to hold  for Bo
doesn't want
Cust called to cancel the order  He can no longer get the product he wants 
cnt hld
will not comply with export req
cant' hold
Custs request
Cust will not hold for BO
per. cust. request.

ところで、私は SQL Server 2005 を持っています。

4

3 に答える 3

4

あなたの問題の一部は、これが本当に理由コードではないということです。あなたのスキーマの問題のように思えます。参照する事前定義された理由コードがなく、それぞれの理由に対して自由なテキスト入力を許可している場合、明確な理由を引き戻す以外に、これを直接行う方法は実際にはありません。これはおそらくあまり役​​に立ちません。

仮の環境またはテスト環境であっても、テーブルに別の列を追加して、ビジネス ユーザーがコードを割り当てることができるようにすることはできますか (例: 1 は誤出荷、2 は重複注文、3 は誤出荷)。商品等)ご注文キャンセル毎に承ります。次に、その分析を実行します。

それが彼らがあなたに期待していることだと思いますが、もっと良い方法があるかどうかはわかりません. 権限/知識があればいつでも自分で分析を実行できますが、キャンセルが多い場合は苦痛になる可能性があります.

編集-これに正規表現でタグ付けしたことがわかりました...指定されたキーワードを設定してエントリを引き出すことは可能ですが、ある程度の許容範囲が組み込まれている必要があり、その後でも手動で分析する必要があります。スペルミスなどにより、特定のカテゴリに分類されません。/編集

于 2009-12-04T18:55:57.597 に答える
1

@jmatthewsに+1してください。理由コードが選択されている必要があり、完全な理由で自由形式のエントリを許可する可能性があります。

これがオプションでない場合は、テキスト クラスタリングを調べることができます。ただし、高速または簡単であるとは思わないでください。これはまだ未解決の研究トピックであり、AI と機械学習の両方に関連しています。

于 2009-12-04T19:03:39.143 に答える
1

SSIS の Term Lookup を見てください。ここに記事があります。

于 2009-12-04T19:04:50.310 に答える