こんにちは、私はスクレイピーに取り組んでいます
以下は私のコードです
class examplespider(CrawlSpider):
name = "example"
domain_name = "www.example.com"
start_urls = ["http://www.example.com/sch/mobile-/67939/i.html?_catref=1"]
def parse(self,response):
hxs = HtmlXPathSelector(response)
for i in xrange(1,10):
yield Request(url="http://www.example.com/sch/mobile-/67939/i.html?_catref=1?_trkparms=65%253A12%257C66%253A1%257C39%253A1%257C72%253A3276&rt=nc&_catref=1&_dmpt=IN_Mobile_Phones&_trksid=p3286.c0.m14.l1513&_pgn=%d"%i,
callback=self.parse_item)
def parse_item(self,response):
print response,"Here it is................."
結果: :
File "/home/local/username/project/example/example/spiders/example_spider.py", line 117, in parse
yield Request(url="http://www.example.com/sch/mobile-/67939/i.html?_catref=1?_trkparms=65%253A12%257C66%253A1%257C39%253A1%257C72%253A3276&rt=nc&_catref=1&_dmpt=IN_Mobile_Phones&_trksid=p3286.c0.m14.l1513&_pgn=%d"%i,
callback=self.parse_item)
exceptions.ValueError: unsupported format character 'A' (0x41) at index 61
コードの何が問題なのか、サポートされていない形式の文字コード エラーが表示される理由、ここで URL がサポートされていないかどうか、また、形式指定子なしで単一の整数を指定すると、応答を取得できるかどうかを教えてください。上記を教えてください、
前もって感謝します。