基本的なSQLとアクティブなレコードクエリ言語を使用して、単一のテーブル内で正確に重複するレコードを見つける方法を知っています. しかし、スペルミスを考慮して、近似一致検索を実行する方法を知る必要があります。Railsアプリで潜在的な重複を見つけて一致を近づける最良の方法は何ですか? データベースとしてMySQLを使用しています。
編集:一致させたいデータのタイプは文字列で、データベースに文字列として保存されます。
基本的なSQLとアクティブなレコードクエリ言語を使用して、単一のテーブル内で正確に重複するレコードを見つける方法を知っています. しかし、スペルミスを考慮して、近似一致検索を実行する方法を知る必要があります。Railsアプリで潜在的な重複を見つけて一致を近づける最良の方法は何ですか? データベースとしてMySQLを使用しています。
編集:一致させたいデータのタイプは文字列で、データベースに文字列として保存されます。
thinking_sphinxとSphinxは、あなたにとって興味深い 2 つのツールであると思います。あなたが望むものは、全文検索と呼ばれる一連の機能によって提供されます。これは、単一の回答で説明する大きなトピックですが、おそらく「単語の近接性」と「語彙素」について学びたいと思うでしょう。