ここで私の問題について助けが必要か、少なくともいくつかのアドバイスが必要です。XPATH を使用して HTMLcleaner を使用して HTML ドキュメントを解析しています。
私はこのようなものを持っています:
<html>
[code and other <h4> tags]
<h4>Random name</h4>
<a href="link" target="target"> Text I want to get </a>
<a href="link2" target="target2"> Text I want to get 2 </a>
<a href="link3" target="target3"> Text I want to get 3 </a>
<a href="link4" target="target4"> Text I want to get 4 </a>
<h4> Random name 2 </h4>
<a href="link" target="target"> Text I don't want to get </a>
[code and other <h4> tags]
</html>
Ok。いくつかの<h4>
タグがあり、それぞれに<a>
タグといくつかのテキストがあります。私の問題は、「h4 [i]」のように、特定の からそれぞれのテキストをすべて取得する方法がわからないことです。私はこのようなことを試しましたが、うまくいきませんでした:
String xpath = "h4["+number+"]//a" //where number will increment
アドバイスありがとうございます!