Javaでjericho htmlパーサーを使用しています。ウェブサイトからデータを取得したい。ウェブサイトのhtmlコンテンツでは、このようなものです....
<div class="class_div">
<div class="class_div2">All contents...</div>`
<span class="equals">Content 1</span>
<span class="equals">Content 2</span>
<span class="equals">Content 3</span>
<span class="equals">Content 4</span>
</div>
コンテンツ 1、コンテンツ 2、コンテンツ 3、コンテンツ 4 をフェッチしたいのですが、これをフェッチするにはどうすればよいですか?
このコードを使用しています
String sourceUrlString="<website url>";
if (sourceUrlString.indexOf(':')==-1)
sourceUrlString="http:"+sourceUrlString;
Source source=new Source(new URL(sourceUrlString));
Element bodyContent = source.getElementByClass("equals");`