0

Scrapy を使用して、ルールが従うCrawlSpiderページの URL を取得する正規の方法はありますか。たとえば、コールバック メソッドでページ Bを解析するときにページ Aからページ Bへのリンクがあった場合、ページ Aの URL を知る方法はありますか? クラスを拡張するよりも、組み込み機能に興味があります。CrawlSPider

4

1 に答える 1

0

コールバックでは、応答のリクエスト ヘッダーで「Referer」ヘッダーを使用できます。

    def mycallback(self, response):
        print "Referer:", response.request.headers.get("Referer")
        ...

すべてのスパイダーで動作するはずです。

于 2013-07-21T21:19:15.287 に答える