cmsで重複したテキストを見つけるための、実装が簡単なアルゴリズムを探しています。実際には、テキストを空白を削除して余分な列に保存し、すべての文字を小文字にして、スペースの量と大文字と小文字が異なる場合に重複を見つけることができますが、それだけでは十分ではありません。
2 つのテキストが数文字異なっていて、それらを重複として認識させたい場合、どのように対処すればよいですか?
cmsで重複したテキストを見つけるための、実装が簡単なアルゴリズムを探しています。実際には、テキストを空白を削除して余分な列に保存し、すべての文字を小文字にして、スペースの量と大文字と小文字が異なる場合に重複を見つけることができますが、それだけでは十分ではありません。
2 つのテキストが数文字異なっていて、それらを重複として認識させたい場合、どのように対処すればよいですか?