1

私は Web スクレイパーを書いており、Perl の初心者です。必要なデータを取得するために使用HTML::TreeBuilderしていますが、処理方法がわからないケースに遭遇しました。サンプル HTML を次に示します。

<div class="anything" val="20" name="matchup">someUniqueData</div>

valこの HTML タグからを抽出したいと思います。ほとんどの作業を行うために使用してきましたがfindvalues()、タグ内からデータを取得できるかどうかはわかりません。私はドキュメンテーションに失敗しました。このタイプのスクレイプに対する簡単な解決策はありますか?

4

1 に答える 1

3

あなたが必要です(を使用してHTML::TreeBuilder::XPath):

my ($val) = $tree->findvalues('//div[@class="anything"]/@val');
于 2013-07-15T04:06:07.547 に答える