0

次のページの画像xpathを見つけようとしています:http ://www.spoonsisters.com/product/1032000/38710.html

ブラウザでimage_urlを表示できますが、Mechanizeで検索しようとすると次のようになります。

page = Agent.get("http://www.spoonsisters.com/product/1032000/38710.html")
page.parser.xpath('('//*[@id="main_image"]')')
 => [#<Nokogiri::XML::Element:0x80484c7c name="img" attributes=[#<Nokogiri::XML::Attr:0x80484bdc name="id" value="main_image">, #<Nokogiri::XML::Attr:0x80484bc8 name="src">, #<Nokogiri::XML::Attr:0x80484b8c name="alt" value="Paper Cocktail Napkins - What happens tonight goes on Facebook tomorrow">]>] 

'src'>が空白になります。image_urlを見つけるにはどうすればよいですか?

4

1 に答える 1

0

これは、ページの読み込み時にその画像 src が JavaScript によって設定されているためです。ソースを見て「main_image」を検索すると、次のように表示されます。

<img id="main_image" src="" alt="Bar Towel - Wine Varietals" />

Mechanize には JavaScript を実行する機能がないため、常に空の文字列になります。

于 2012-07-21T03:52:12.533 に答える