jsoupを使用してインドの都市と町のURLリストからすべての都市名と州名を抽出したいのですが、そのページのHTMLコードスニペットを以下に示します。
ここで、 Abhaypuriは都市の名前であり、Assamは州の名前です。また、同様の都市名と州名が、何千回も表示されるこのようなテーブル構造でページに何度も表示されます。ここでは、tdタグ内 のurlを除いてすべてが同じです。
<table class="wikitable sortable" style="text-align:;">
<tr>
<th>Name of City/Town</th>
<th>Name of State</th>
<th>Classification<pre><code></th>
<th>Population (2001)<pre><code></th>
<th>Population (2011)<pre><code></th>
</tr>
<tr>
<td><pre><code><a href="/wiki/Abhayapuri" title="Abhayapuri">Abhayapuri<pre><code></a><pre><code></td>
<td><pre><code><a href="/wiki/Assam" title="Assam">Assam<pre><code></a><pre><code></td>
私はjsoupを初めて使用します。どんな助けでもいただければ幸いです。ありがとうございました。