js や coffeescript に慣れていないので、casperjs を使用してページをダウンロードし、python を使用してそれを解析するつもりでした。しかし、ダウンロードしたページは、ブラウザで見たものとは異なり、実際には、ページが保存される前に読み込まれていない部分がありました。その理由は、onload コールバックが実行されていないことが原因である可能性があります。ブラウザに表示されているページと同じページをダウンロードしたい場合はどうすればよいですか? どうもありがとう!
私のコード(コーヒースクリプト):
urls =
'jd' : 'http://list.jd.com/652-654-831-0-0-0-0-0-0-0-1-1-1-1-1-72-4137-33.html'
casper = require("casper").create()
process = (urls) ->
casper.start "", ->
@echo "begin to work"
for name, url of urls
casper.thenOpen url, ->
@echo @download url, "#{name}.html"
process(urls)
casper.run()