1

そのため、最初に正規表現でワードプレスサイトを識別し、次にログインページなどにアクセスしようとする小さなスニペットを書いています.

これをもっと最適化できますか?属性間の空白を考慮する必要がありますか?

Regex wordPressPattern = new Regex("(<meta name=\"generator\" content=\"WordPress)| (Powered by <a href=\"http://www.wordpress.org\")+", RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.Singleline);
4

1 に答える 1

1

いくつかの改善:

  • スペースを考慮する
  • +意味がないので、最後の を削除します
  • wwwを作る。オプション
  • httpsS にする (S はオプション)
  • 二重引用符 (有効な HTML) の代わりに単一引用符がある場合はどうなりますか? 我々は使用するだろう("|')
  • name=\"generator\"関係ないと思うので使って最後.*?に追加します[^>]*>

要約すると:

(<meta.*?content\s*=\s*(\"|')WordPress[^>]*>)|(Powered\s+by\s+<a\s+href\s*=\s*(\"|')http(s)?://(www.)?wordpress.org(\"|'))
于 2013-04-26T19:52:29.297 に答える