基本的に私がやりたいのは、htmlテーブル全体を.txtファイル(メモ帳ドキュメント)にエクスポートすることです。
これまでのところ、テーブルを含むhtmlページを見つけるようにブラウザに指示する方法を学びました。
require 'rubygems'
require 'hpricot'
require "watir-webdriver"
url = "http://www.example.com"
browser = Watir::Browser.new
browser.goto url
上記をcmdで実行した後、ブラウザにhtmlテーブルが表示されます。
これは私が立ち往生しているところです。Watirを使用して
- タグを見つける
- および内にあるすべて(つまり、html、およびテキスト)を収集します。
- これらの結果を.txtファイル(メモ帳ドキュメント)に抽出し、特定のフォルダーに保存します。
参考までに、htmlテーブルは次のようになります...
<table border="1" cellpadding="2">
<tr>
<th> Address </th>
<th> Council tax band </th>
<th> Annual council tax </th>
</tr>
<tr>
<td> 2, STONELEIGH AVENUE, COVENTRY, CV5 6BZ </td>
<td align="center"> F </td>
<td align="center"> £2125 </td>
</tr>
.......上記の行は何度も繰り返されます.....。
</table>
その後、テーブルが閉じられます。
だから私の状況を要約します。Watirを使用してブラウザをhtmlテーブルを含むページに移動できますが、私の問題は、結果(タグ内のすべて-htmlを含む)を.txtファイルに抽出してその.txtを保存する方法がわからないことです。私のコンピュータにファイルします。
Watirを使用して、より小さなステップを実行したいと思います。私はそれを知っているので、テーブルを抽出し、抽出したすべてのものを.txtファイルに保存する方法を学びたいと思います。hpricotを使用してオンラインでいくつかの例を見てきました。ただし、ほとんどの例では、配列が.txtファイルに出力される方法(それが正しいアプローチである場合)の詳細を示すコードが欠落しているようです。
htmlテーブル(および、を含むすべて、およびその間のすべて)を.txtメモ帳ファイルに抽出する簡単なコードを記述する方法を示すことで助けてもらえますか?
お時間をいただき、ありがとうございました。