python - Scrapy.crawlerとscrapy.spiderの違いは?

Question

私は Scrapy を初めて使用し、クローラーとスパイダーについてかなり混乱しています。どちらもウェブサイトをクロールしてアイテムを解析できるようです。

Crawlerクラス (/usr/local/lib/python2.7/dist-packages/scrapy/crawler.py) とCrawlerSpiderクラス ( /usr/local/lib/python2.7/dist-packages/scrapy/contrib)があります。/spiders/crawl.py) を Scrapy で。誰かがそれらの違いを教えてくれますか? また、どのような状況でどちらを使用すればよいですか?

よろしくお願いします！

score 2 · Accepted Answer

CrawlerSpider は BaseSpider のサブクラスです。これは、「ルール」リストに従ってスパイダーにリンクをたどらせたい場合に拡張する必要がある呼び出しです。「Crawler」は、CrawlerProcess によってサブクラス化されたメインのクローラーです。スパイダーで CrawlerSpider をサブクラス化する必要がありますが、クローラーに触れる必要はないと思います。

python - Scrapy.crawlerとscrapy.spiderの違いは?

1 に答える 1

Related

Reference