div 要素を示す Java 文字列があります。
String source = "<div class = \"ads\">\n" +
"\t<dl style = \"font-size:14px; color:blue;\">\n" +
"\t\t<li>\n" +
"\t\t\t<a href = \"http://ggicci.blog.163.com\" target = \"_blank\">Ggicci's Blog</a>\n" +
"\t\t</li>\n" +
"\t</dl>\n" +
"</div>\n";
HTML形式では次のとおりです。
<div class = "ads">
<dl style = "font-size:14px; color:blue;">
<li>
<a href = "http://ggicci.blog.163.com" target = "_blank">Ggicci's Blog</a>
</li>
</dl>
</div>
そして、dl要素を抽出するためにそのような正規表現を書きます:
<dl[.\\s]*?>[.\\s]*?</div>
しかし、何も見つからず、次のように変更しました。
<dl(.|\\s)*?>(.|\\s)*?</div>
それは動作します。だから私はこのようにテストしました:
System.out.println(Pattern.matches("[.\\s]", "a")); --> false
System.out.println(Pattern.matches("[abc\\s]", "a")); --> true
なぜ「。」「a」と一致しませんか?