4

Scrapy を使用して Web サイトをクロールし、データを json ファイルに抽出していますが、一部のサイトでは、クローラーが Web サイト全体をクロールするのに時間がかかることがわかりました。

私の質問は、クロールにかかる時間を最小限に抑えるにはどうすればよいですか?

4

1 に答える 1

3

CONCURRENT_ITEMSCONCURRENT_REQUESTSCONCURRENT_REQUESTS_PER_DOMAINおよびその他の設定を調整してみてください。

設定の完全なリストについては、http://doc.scrapy.org/en/latest/topics/settings.html を参照してください

于 2013-10-01T17:37:51.163 に答える