私はScrapy
ウェブサイトをクロールするために使用しています。クロールする必要があるリンクの形式はhttp://www.somesite.com/details.html?pageId=<some_integer_id>
. の値は~ から(厳密には 100 ではありません)some_integer_id
まで拡張されます。私がすることはこれです:1
100
1. URL のリストを生成する関数を作成します。
def generateURLs(self):
url_list = []
for i in range(1, 101):
url_list.append('http://www.somesite.com/details.html?pageId=%d' % i)
return url_list
2.この関数を使用して、の値を次start_urls
のScrapy
ように設定します。
def __init__(self):
self.start_urls = self.generateURLs()
これは推奨される使用方法Scrapy
ですか、それともリクエスト パラメータの値を変更する必要がある場合にこれを行うための他のより良い方法はありますか?
ありがとう。