私は、scraperwiki(http :/ /scraperwiki.com/scrapers/food_standards_agency/)が、次の形式の「次の」ページのリンクをたどろうとすると問題が発生します。
<input type="submit" name="ctl00$ContentPlaceHolder1$uxResults$uxNext" value="Next >" id="ctl00_ContentPlaceHolder1_uxResults_uxNext" title="Next >" />
フォームハンドラは次のようになります。
<form method="post" action="QuickSearch.aspx?q=po30" onsubmit="javascript:return WebForm_OnSubmit();" onkeypress="javascript:return WebForm_FireDefaultButton(event, 'ctl00_ContentPlaceHolder1_buttonSearch')" id="aspnetForm">
<input type="hidden" name="__EVENTTARGET" id="__EVENTTARGET" value="" />
<input type="hidden" name="__EVENTARGUMENT" id="__EVENTARGUMENT" value="" />
<input type="hidden" name="__LASTFOCUS" id="__LASTFOCUS" value="" />
[次のリンク]を手動でクリックしたときのHTTPトレースでは、__ EVENTTARGETが空であると表示されますか?他のスクレーパーで見つけることができるすべてのベビーベッドは、次のページを処理する方法として__EVENTTARGETの操作を示しています。
確かに、スクレイプしたいページが次のページをどのようにロードするのかわかりませんか?スクレーパーに何を投げても、最初の結果ページをロードすることしかできません。(1ページあたりの結果数を変更できることも便利ですが、その方法もわかりません!)
それで、N>0の1+ N番目の結果ページをスクレイプする方法についてのアイデアはありますか?