私はウェブサイトをスクラップするためのスパイダーを書いています:
最初の URL www.parenturl.com は parse 関数を呼び出します。そこから、parse2 関数へのコールバックがある URL www.childurl.com を抽出し、dict を返します。
質問 1) dict 値を、解析関数で親 URL から抽出した他の 7 つの値と共に mysql データベースに格納する必要がありますか? (response_url は何も出力しません)
def parse(self, response):
for i in range(0,2):
url = response.xpath('//*[@id="response"]').extract()
response_url=yield SplashFormRequest(url,method='GET',callback=self.parse2)
print response_url # prints None
def parse2(self, response):
dict = {'url': response.url}
return dict