1

http://www.imdb.com/find?q=Yek+mard%2C+yek+khers&s=allの HTML をスクレイピングしようとしています。結果セットには、クラス内に 1 つの結果が含まれますresult_text。リンクを入力し、そのリンク内のテキストを取得します。この場合、Firebug が示すように、A Man, a Bear. しかし奇妙なことに、次のコードはYek mard, yek khers. ブラウザに表示されているテキストを取得する方法について誰か助けてもらえますか?

$name = "Yek mard, yek khers";
$uri = URI->new("http://www.imdb.com/find?q=".uri_escape($name)."&s=all");
my $response = $ua->get( $uri );

my $root = HTML::TreeBuilder->new_from_content($response->decoded_content);
@results = $root->find_by_attribute("class","result_text");
$link = $results[0]->find_by_tag_name("a");
say $link->as_HTML();
# This should print <a href="/title/tt0122857/?ref_=fn_al_tt_1">A Man, a Bear</a>
# but prints <a href="/title/tt0122857/?ref_=fn_al_tt_1">Yek mard, yek khers</a>
4

1 に答える 1