3 つのテーブルを含む html ファイルがあります。しかし、3 つのテーブルのうち 1 つだけを抽出したいと考えています。どうすればいいですか?
2 に答える
1
次のような既知Perl
のモジュールを使用してこれを行うことができます。
LWP
WWW::Mechanize
HTML::TreeBuilder
HTML::TreeBuilder::XPath
すべてhttp://search.cpan.orgにあります
最後の Perl モジュールは非常に便利です。次Xpath
のような式を使用できます。
//table[0]/tr[3]/td[2]/text()
たとえば、最初の要素から3 番目td
の要素の 2 番目の要素のテキストを出力します。tr
table
于 2012-10-23T20:12:35.163 に答える
0
HTML ドキュメントの一部を抽出するのに適したモジュールはHTML::Query
.
ドキュメントのどの部分を抽出するかを選択するための jQuery に似たインターフェースを提供します。
于 2012-10-23T20:19:42.197 に答える