私はスクレイパーウィキに非常に単純な python スクリプトを持っています:
import scraperwiki
import lxml.html
html = scraperwiki.scrape("http://www.westphillytools.org/toolsListing.php")
print html
私はそれを解析するためにまだ何も書いていません...今のところ、私はhtmlが欲しいだけです。
編集モードで実行すると、完全に機能します。
スケジュールされたスクレイプが実行される (または私が手動で実行する) と、数十行 (場合によっては数百行) が省略されます。
これは非常に小さな Web ページであるため、データのオーバーロードは問題になりません。何か案は?