私は基本的なスクリーン スクレーパーを作成しており、正常に完了しましたが、何らかの理由でコードのこの部分が目的の img タグを取得できません。指定された id の div の後に img src を取得しようとしていますが、スクリプトはページの最初の img タグを取得しています。たとえば、このサンプル コミック スクレーパー
$agent->get("http://www.blondie.com/todays_strip/");
$stream = HTML::TokeParser->new(\$agent->{content});
$tag = $stream->get_tag("div");
while ($tag->[1]{id} and $tag->[1]{id} ne 'comicpanel') {
$tag = $stream->get_tag("div");
}
my $blondie_comic = $stream->get_tag("img");
print $cgi->h1("$blondie_comic->[1]{'src'}");
上記のスニペットは、コミック ストリップの img に進むのではなく、最初に見つかったイメージ タグであるロゴの src を出力するだけです。
前もって感謝します。