HtmlAgilityPack を使用して Web ページを解析しています。ドキュメントが読み込まれたら、可能な電話番号を HTML から抽出したいと考えています。現在、この目的のためにいくつかの正規表現を使用しています。Webページの電話番号の一致をチェックする次のコードがあります
private static string phoneReg =
@"[\+]{0,1}(\d{10,13}|[\(][\+]{0,1}\d{2,}[\13)]*\d{5,13}|\d{2,6}[\-]{1}\d{2,13}[\-]*\d{3,13})";
private static Regex phoneRegex = new Regex(phoneReg, RegexOptions.IgnoreCase);
var phoneMatches = phoneRegex.Matches(doci.DocumentNode.InnerText);
HTMLアジリティパックからの抽象化はどこにdoci
ありますか。問題は、や などHtmlDocument
の一部の電話番号と一致しないことです。08450 211 211
+44 (0) 1246 733 000
Web サイトをクロールするときに最適で、ほとんどの形式の国際電話番号を照合できる一般的な正規表現はありますか?