フォーラムから既にクロールして保存したこの html ファイルがあります。クロールされたデータからすべてのスレッド タイトルを抽出したいのですが、問題は、スレッド タイトルの一部を出力できますが、すべてではなく、スレッド タイトルの一部をスキップすることです。
実際の HTML のサンプルを添付しました。注: "threadbits_forum_2" 2 は実行中の番号です
<tbody id="threadbits_forum_2">
<tr>
<td>Thread1</td>
</tr>
<tr>
<td>Thread2</td>
</tr>
<tr>
<td>Thread3</td>
</tr>
<tr>
<td>Thread4</td>
</tr>
.
.
.
.
</tbody>
Java コーディング:
Document doc = Jsoup.parse(html);
Elements threadsList = doc.select("tbody[id^=threadbits_forum]").select("tr");
System.out.println(threadsList.toString());
結果:
<tbody id="threadbits_forum_2">
<tr>
<td>Thread2</td>
</tr>
<tr>
<td>Thread4</td>
</tr>
すべてのスレッドのタイトルを取得するための回避策はありますか?
私の投稿を読んでくれてありがとう。
キース