scrapy-splash
ミドルウェアを使用しSplash
て、ドッカー コンテナー内で実行されている JavaScript エンジンを介してスクレイピングされた HTML ソースを渡してきました。
スパイダーでスプラッシュを使用する場合は、いくつかの必要なプロジェクト設定を構成し、Request
特定のmeta
引数を指定します。
yield Request(url, self.parse_result, meta={
'splash': {
'args': {
# set rendering arguments here
'html': 1,
'png': 1,
# 'url' is prefilled from request url
},
# optional parameters
'endpoint': 'render.json', # optional; default is render.json
'splash_url': '<url>', # overrides SPLASH_URL
'slot_policy': scrapyjs.SlotPolicy.PER_DOMAIN,
}
})
これは文書化されているとおりに機能します。しかし、Scrapy Shellscrapy-splash
内でどのように使用できますか?