0

スクレイピーから httpcache ミドルウェアに直接アクセスするにはどうすればよいですか?

疑似コードでそのようなもの

URL = 'http://scrapedsite.com/category1/item1'
print retrieveRawHtml(URL)
4

1 に答える 1

3
from scrapy.utils.response import open_in_browser
from scrapy.http import HtmlResponse
url = 'http://scrapedsite.com/category1/item1'
body = '<html>hello</html>'
response = HtmlResponse(url, body=body)
open_in_browser(response)

またはあなたのコールバックから:

def parse_cb(self, response):
    from scrapy.utils.response import open_in_browser
    open_in_browser(response)

キャッシュが有効になっている場合は、キャッシュからプルされます。

于 2013-03-19T22:16:56.383 に答える