python - SgmlLinkExtractor と文字列内の一致単語の正規表現

Question

特定の URL を解析するために、scrapy で SgmlLinkExtractor 機能を使用しています。

動的 URL をクロールするために start_requests 関数をオーバーライドします。

これは次のようになります。

start_requests(self): ..... yield Requests(url.strip(), callbackA)

コールバック A は現在何もしません。

SgmlLinkExtractor の process_value も実装しましたが、呼び出されませんでした。

rules = [Rule(SgmlLinkExtractor(allow=()), callback=callbackB, follow=True),]

この場合も callbackB は呼び出されませんでした。

score 0 · Accepted Answer

コールバックがスパイダーで宣言されている場合、それらはグローバルスコープを持たず、次のようにクラスにスコープされているものとして参照する必要がありますself.。

rules = [
  Rule(SgmlLinkExtractor(), callback=self.callbackB, follow=True),
]