私は Perl を使い始めたばかりで、Web スクレイピングを行うための簡単なスクリプトを作成しました。私は WWW::Mechanize と HTML::TreeBuilder を使用してほとんどの作業を行っていますが、いくつかの問題に遭遇しました。私は次のHTMLを持っています:
<table class="winsTable">
<thead>...</thead>
<tbody>
<tr>
<td class = "wins">15</td>
</tr>
</tbody>
</table>
テーブルからデータを取得するモジュールがいくつかあることは知っていますが、これは特殊なケースです。必要なすべてのデータがテーブルにあるわけではありません。だから、私は試しました:
my $tree = HTML::TreeBuilder->new_from_url( $url );
my @data = $tree->find('td class = "wins"');
しかし、@data
空に戻った。でデータを正常に解析したので、このメソッドがクラス名なしで機能することはわかってい$tree->find('strong')
ます。では、このタイプの HTML 構文を処理できるモジュールはありますか? HTML::TreeBuilder のドキュメントをざっと調べたところ、何もないように見えましたが、間違っている可能性があります。