次の形式のサイトがあります。
http://www.domain.com/membership/member_zoom.php?値
値は 1000 で始まり、約 15,000 で停止します
ソースのサンプルは次のとおりです。
<h1>Member Information</h1>
<h2>Company Name</h2>
<p>Address<br />
More Address<br />
City<br />
State<br />
Postal code<br />
</p>
<p><strong>Contact:</strong> Firstname Lastname, PH.D., P.ENG. - <a href="mailto:email@email.com">email@email.com</a><br /></p>
<a href="http://www.domain.com">www.domain.com</a><br />
<p><strong>Phone:</strong> (555)555-5555<br /></p>
そのため、メンバー情報と最後の div タグの間のすべてを取得してから、ID 値を 1 増やして繰り返す必要があります。しかし、死んだIDがたくさんあります。私のスクレーパーはサイトを叩き、一度インクリメントしてからもう一度叩きます。もっと簡単な方法はありますか?おそらく、フェイルセーフを構築する方法はありますか?