初めてJavaで正規表現を使おうとしています。文字列の一部を取得したい。文字列は少し複雑です:
<description>
<a href='http://testlink.html' alt='some text'><img border='0'
src='http://s2.glbimg.com/zzag70iNYX-QK24sUp0YXQmmXhx7yb8j2Sq2YK7tvX3A6vCwEUOFnFTBONQFT-
ni/s.glbimg.com/es/ge/f/original/2012/04/25/image.jpg'
alt='some' title='text' /></a><br />some text; some text
</description>
私のニーズは、hrefとaltにある文字列を取得することです。このために私はこのコードをやっています:
for(Element element : elements)
{
//Elements children = element.children();
Pattern pattern = Pattern.compile("a\\bhref=*(.html|.htm)>");
String[] data = pattern.split(element.text()); ...
}
等々。現時点では、hrefのみを取得しようとしていますが成功していません。戻り値は常に文字列全体です。正しくないですか?保証のためにhtml拡張子を付けましたが、何も起こりません。