そのため、最初に正規表現でワードプレスサイトを識別し、次にログインページなどにアクセスしようとする小さなスニペットを書いています.
これをもっと最適化できますか?属性間の空白を考慮する必要がありますか?
Regex wordPressPattern = new Regex("(<meta name=\"generator\" content=\"WordPress)| (Powered by <a href=\"http://www.wordpress.org\")+", RegexOptions.Compiled | RegexOptions.IgnoreCase | RegexOptions.Singleline);