Google検索をパースして、検索結果から各項目からRSSへのリンクを取得したい。スクレイピーを使用しています。この構築を試みたのですが、
...
def parse_second(self, response):
hxs = HtmlXPathSelector(response)
qqq = hxs.select('/html/head/link[@type=application/rss+xml]/@href').extract()
print qqq
item = response.request.meta['item']
if len(qqq) > 0:
item['rss'] = qqq.pop()
else:
item['rss'] = ''
yield item
...
しかし、「print qqq」は私に与えます
[]