Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
Scrapy を使用して、ルールが従うCrawlSpiderページの URL を取得する正規の方法はありますか。たとえば、コールバック メソッドでページ Bを解析するときにページ Aからページ Bへのリンクがあった場合、ページ Aの URL を知る方法はありますか? クラスを拡張するよりも、組み込み機能に興味があります。CrawlSPider
CrawlSpider
CrawlSPider
コールバックでは、応答のリクエスト ヘッダーで「Referer」ヘッダーを使用できます。
def mycallback(self, response): print "Referer:", response.request.headers.get("Referer") ...
すべてのスパイダーで動作するはずです。