mysql - MySQLで同様の文字列をORDER BYすることは可能ですか?

Question

世界中のさまざまなユーザーからのテキスト入力を含む列があり、それらをグループ化して、類似した文字列がより近くなるようにしたいと考えています。列には、英語以外の言語の文字列が含まれており、さらにスペルミスの単語が含まれている可能性があります。

私はNグラムとレーベンシュタイン距離を調べてきましたが、行を照合するために文字列を念頭に置いている必要があるようです。

例として、私は

   |Comcast               | 
   |how to play basketball|
   |Walmart               |
   |www.Comcast.net       |
   |Wamlart               |
   |basketball            |

最終的には次のようになります。

   |Comcast               | 
   |www.Comcast.net       |
   |how to play basketball|
   |basketball            |
   |Walmart               |
   |Wamlart               |

どんな助けでも大歓迎です。ありがとうございました。

score 1 · Accepted Answer

SOUNDEXコードで注文してみてください。

例えば、

ORDER BY SOUNDEX(MyColumn)

ただし、これは長い文字列では機能しなくなります。Double Metaphone アルゴリズムを使用すると、おそらくよりうまくいくでしょう。

http://www.atomodo.com/code/double-metaphone/metaphone.sql/view

score 0 · Accepted Answer

データを表示する前に、すべての文字列に '.net' のように削除するものがある場合は、次のように実行できます。

SELECT column,ordercolumn FROM 
(
    SELECT column,REPLACE(column,'www.comcast.net','ComCast') ordercolumn
    FROM mytable
) A
ORDER BY ordercolumn,column;

score 0 · Accepted Answer

ORDER BYの代わりに使用GROUP BY

SELECT * FROM table ORDER BY column ASC
SELECT * FROM table ORDER BY column DESC

列はアルファベット順に昇順または降順に並べられます

mysql - MySQLで同様の文字列をORDER BYすることは可能ですか?

3 に答える 3

Related

Reference