アウトバウンドリンクをチェックするために、許可されていないドメインでリクエストを行うためのソリューションを探しています。
しかし、私の関数「parse_outboundLinks」は呼び出されません。
許可されたドメインを変更する必要がありますか?
ご協力いただきありがとうございます
私のコード:
name = "mySpider"
allowed_domains = ["monsite.fr"]
start_urls = ["http://www.monsite.fr/"]
rules = [Rule(SgmlLinkExtractor(allow=()),follow='true',callback='parse_item')]
def parse_item(self, response):
xlink = SgmlLinkExtractor(deny_domains=(self.allowed_domains[0]))
for link in xlink.extract_links(response):
Request(link.url, callback=self.parse_outboundLinks)
def parse_outboundLinks(self, response):
print response.status