URL 文字列内で繰り返されるパターンを検出するための正規表現について誰か助けてくれませんか? 目的は明らかに、不正な奇妙な URL を検出することです。
たとえば、次の URL は問題ありません。
http://www.somewhere.com/help/content/21/23/en/
http://www.somewhere.com/help/content/21/24/en/
http://www.somewhere.com/help/content/21/64/en/
http://www.somewhere.com/help/content/21/65/en/
http://www.somewhere.com/help/content/21/67/en/
これは間違っていますが、タグ付けする必要があります:
http://www.somewhere.com/help/content/21/content/1/54/en/
http://www.somewhere.com/help/content/21/content/1/62/en/
http://www.somewhere.com/help/content/21/content/8/52/en/
内容が2回繰り返されるので。これまでのところ、parse_url と爆発を使用してこれを解決してきましたが、非常に効率が悪いようです!
同様に、パスに数字やその他の値を繰り返す URL が多数ある可能性があることも承知しているため、この問題を解決するための提案は大歓迎です。
どうもありがとう!
この問題をよりよく理解するには、次のリンクにアクセスして、[Administrador MySQL] をクリックしてください。