Web サイトをスクレイピングして、出力を MongoDB に保存しようとしています。コードは問題ないことがわかりますが、単純な出力 (スクレイピー クロール IR -o items.json -t json) を試すと、ファイルは空白になります...しかし、スパイダーのログは、データがスクレイピングされたことを示しています...
ここに私のスパイダーコードがあります
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from teste.items import IngressoRapidoItem
class IngressoRapidoSpider(BaseSpider):
name = "IR"
allowed_domains = ["ingressorapido.com.br"]
start_urls = (
'http://www.ingressorapido.com.br/eventos.aspx?genero=55',
)
def parse(self, response):
hxs = HtmlXPathSelector(response)
items = []
item = IngressoRapidoItem()
item['banda'] = hxs.select('normalize-space(//a[contains(@href,"Evento")] /text())').extract()
item['local'] = hxs.select('normalize-space(//td/span[contains(@style, "normal")]/text())').extract()
items.append(item)
return items
データがスクレイピングされていても出力が null になる理由を誰でも推測できますか? 前もって感謝します