Ruby と Mechanize をインストールしました。のこぎりでは自分のやりたいことができるように思えますが、どうすればいいのかわかりません。
これはどうtable
ですか?これは、vBulletin フォーラム サイトの HTML の一部にすぎません。HTML 構造を維持しようとしましたが、一部のテキストとタグ属性を削除しました。スレッドごとに、タイトル、作成者、日付、時間、返信、ビューなどの詳細を取得したいと考えています。
HTML ドキュメントにはテーブルがほとんどないことに注意してください。私は、そのtbody
,を持つ特定のテーブルの後にい<tbody id="threadbits_forum_251">
ます。名前はいつも同じです(願っています)。コードでtbody
とを使用できますか?name
<table >
<tbody>
<tr> <!-- table header --> </tr>
</tbody>
<!-- show threads -->
<tbody id="threadbits_forum_251">
<tr>
<td></td>
<td></td>
<td>
<div>
<a href="showthread.php?t=230708" >Vb4 Gold Released</a>
</div>
<div>
<span><a>Paul M</a></span>
</div>
</td>
<td>
06 Jan 2010 <span class="time">23:35</span><br />
by <a href="member.php?find=lastposter&t=230708">shane943</a>
</div>
</td>
<td><a href="#">24</a></td>
<td>1,320</td>
</tr>
</tbody>
</table>