以下のようなhtmlファイルを取得しました。
<a href="http://...123"><img src="http://...jpg?" border="0"/></a>
<a href="http://...456">
.
.
.
href リンクと img src の属性を HashMap に取得したいのですが、
ただし、いくつかの(すべてではない)<a href="">
タグはタグと一致しません<img src="">
。
では、属性 href リンクと img src のペアを HashMap に取得するにはどうすればよいですか?
もし href が img src なしでリンクしているなら、行を放棄してください。