次のようなテーブルを含むページがあります。
<html>
<ol>
<li>entry1</li>
<li>entry2</li>
<li>entry3</li>
<li>entry4</li>
</ol>
</html>
ページ上の「エントリ」の発生をカウントし、それぞれがテーブルのどの行に配置されているか (ここでは 1 行目) を抽出したいと考えています。
このタスクを実行する Java ツールはありますか? カウントを検索するには、RegEx と Matcher パターンを使用します。しかし、そのドキュメントから表の行を抽出するにはどうすればよいでしょうか?