制御された入力を使用していない従来のデータ入力システムを使用しています。すべてが varchar(max) フィールドに格納されますが、残念ながら、言い方には多くのバリエーションが含まれています。
何かがいつ調整されたかを知りたい場合、「どこで t.col が '%cal%' のようになったか」とだけ言うことはできません。
「CAL、CAL.、Calib.Calibrate、calibrate、Calibration、calibration、Cal'd...」のような場合には機能しますが、スペルが間違っているバリアントでは機能しません。
また、その人は「NO cal reqd, don't cal.」と言っているかもしれません。
テキストは、アクションが行われたことを「推測」する場合があります。「キャリブレーション」は、「ベースラインに調整、手順ごとに調整」と書かれている場合があります。
あるケースからわかるように、文字通り何千もの潜在的な「ルール」があります。
約 30,000 件のレコードを処理し、データが分類される約 30 (0,1 / true/false) のカテゴリにインテリジェントに解析するのに約 2 週間かかりました。
T-SQLを使用して手動処理を置き換える便利なクエリ構造を誰かが教えてくれるかどうか知りたいです。