スクレイピーを試して、基本的なスパイダーを動かそうとしています。これはおそらく私が見逃しているものであることはわかっていますが、考えられることはすべて試しました。
私が得るエラーは次のとおりです。
line 11, in JustASpider
sites = hxs.select('//title/text()')
NameError: name 'hxs' is not defined
現時点では、私のコードは非常に基本的なものですが、どこが間違っているのかまだわかりません。助けてくれてありがとう!
from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
class JustASpider(BaseSpider):
name = "google.com"
start_urls = ["http://www.google.com/search?hl=en&q=search"]
def parse(self, response):
hxs = HtmlXPathSelector(response)
sites = hxs.select('//title/text()')
for site in sites:
print site.extract()
SPIDER = JustASpider()