テキストフィールドを検索して類似している可能性のある行を特定し、それらが重複していてマージする必要があるかどうかを特定できるようにする方法を見つけようとしています。たとえば、私のデータが次のようになっている場合:
MyText_Column
- ボブ
- ボビー
- ロバート
- ジェーン
- ジェニー
- ジャニー
- ジョー
- ジョン
- ジョナサン
値がまったく同じではないため、GROUP BYは機能しませんが、1つの行が類似している可能性のリストを返すクエリがあれば、それは素晴らしいことです。より良いレイアウトがあるかもしれませんが、私が想像しているのは次のような結果です。
クエリ結果
検索比較Likely_Match
- ボブボビー96%
- ボブ・ロバート12%
- ボブジェーン0%
- ボブ・ジャニー0%
- ....。
- ジェーンジャニー87%
- ジェーンジャニー69%
- ジェーンジョー12%
次に、そのような結果で、可能性で並べ替え、視覚的にスキャンして、結果が重複しているかどうかを判断できます。