私は 1 つの Web サイトをクロールし、いくつかのコンテンツと画像を解析していますが、100 ページ程度の単純なサイトであっても、その作業には何時間もかかります。以下の設定を使用しています。どんな助けでも大歓迎です。私はすでにこの質問を見てきました - Scrapy の Scrapyd は、スパイダーのスケジューリングでは遅すぎますが、多くの洞察を集めることができませんでした。
EXTENSIONS = {'scrapy.contrib.logstats.LogStats': 1}
LOGSTATS_INTERVAL = 60.0
RETRY_TIMES = 4
CONCURRENT_REQUESTS = 32
CONCURRENT_REQUESTS_PER_DOMAIN = 12
CONCURRENT_ITEMS = 200
DOWNLOAD_DELAY = 0.75