以下のタグから、サイト「 http://www.firstcry.com/teethers-and-soothers/5/98?ref2=menu_dd 」から製品の URL をスクレイピングしたい:
<a href="http://www.firstcry.com/nuby/nuby-orthodontic-pacifier/140905/product-detail" id="ctl00_ContentPlaceHolder1_productdisplay_gvProductListDetails_ctl01_lnk_Image" onclick="jmp(this)">
<img id="ctl00_ContentPlaceHolder1_productdisplay_gvProductListDetails_ctl01_Img_view" title="Nuby - Orthodontic Pacifier" class="resizeimg" src="http://cdn.firstcry.com/brainbees/images/products/bigthumb/140905a.jpg" alt="Nuby - Orthodontic Pacifier" style="border-width:0px;border: none;vertical-align: middle;" original="http://cdn.firstcry.com/brainbees/images/products/bigthumb/140905a.jpg">
</a>
私はこのようなことをしたい:
return [].map.call(document.querySelectorAll('a)'), function(link) {
return link.getAttribute('href');
});
この要素にはクラス名がなく、ID もすべての製品で異なるため、これを行う方法がわかりません。可能であれば、ファントムで x-path を使用する方法もわかりません。