1

Google検索をパースして、検索結果から各項目からRSSへのリンクを取得したい。スクレイピーを使用しています。この構築を試みたのですが、

...
def parse_second(self, response):
    hxs = HtmlXPathSelector(response)
    qqq = hxs.select('/html/head/link[@type=application/rss+xml]/@href').extract()
    print qqq
    item = response.request.meta['item']
    if len(qqq) > 0:
        item['rss'] = qqq.pop()
    else:
        item['rss'] = ''    
    yield item
...

しかし、「print qqq」は私に与えます

[]
4

1 に答える 1

1

間違いを見つけました:

qqq = hxs.select("/html/head/link[@type='application/rss+xml']/@href").extract()

それは動作します

于 2010-07-29T12:06:59.853 に答える