-2

3 つのテーブルを含む html ファイルがあります。しかし、3 つのテーブルのうち 1 つだけを抽出したいと考えています。どうすればいいですか?

4

2 に答える 2

1

次のような既知Perlのモジュールを使用してこれを行うことができます。

  • LWP
  • WWW::Mechanize
  • HTML::TreeBuilder
  • HTML::TreeBuilder::XPath

すべてhttp://search.cpan.orgにあります

最後の Perl モジュールは非常に便利です。次Xpathのような式を使用できます。

//table[0]/tr[3]/td[2]/text()

たとえば、最初の要素から3 番目tdの要素の 2 番目の要素のテキストを出力します。trtable

于 2012-10-23T20:12:35.163 に答える
0

HTML ドキュメントの一部を抽出するのに適したモジュールはHTML::Query.

ドキュメントのどの部分を抽出するかを選択するための jQuery に似たインターフェースを提供します。

于 2012-10-23T20:19:42.197 に答える