htmlparser を使用して以下を解析したいと思います。タイトルのコードを書き、正常に動作しました。次のタグを試しましたが、何も機能していません。この種のプログラミングを初めて行っているのを助けてください。1) img タグから img src url を取得したい
<div id="images">
<img src="../images/abc.jpg" align="right" style="padding-right:5px;">
<li>
2)タグ間のテキスト コンテンツを取得したい。
<ul>
<li>hello</li>
<li>how r u?</li>
<li>bye</li>
</ul>
次のコードで img タグ src url を取得しようとしましたが、nullpointer 例外がスローされます。
Parser parser=new Parser();
HasAttributeFilter imgfil=new HasAttributeFilter("align","right");
NodeList img=parser.parse(imgfil);
Node node1=img.elementAt(0);
ImageTag tg=(ImageTag) node1;
String url=tg.getText();
System.out.println(url);
次のスニペットも試しましたが、何も機能しません。
NodeList img=parser.extractAllNodesThatMatch(new AndFilter(new TagNameFilter("img"),new HasAttributeFilter("align","right")));
SimpleNodeIterator iterate=img.elements();
while (iterate.hasMoreNodes())
{
Node node1 = iterate.nextNode();
ImageTag tag = (ImageTag)node1;
System.out.println(tag.getImageURL());
}