私は Scrapy が初めてで、何をする必要があるかどこにも見つかりません。
非常によく似た一連の URL をスクレイピングする必要がありますが、ある URL から別の URL にアクセスできません。たとえば、次の URL をスクレイピングする必要があります。
www.example.com/1.html
www.example.com/2.html
(...)
www.example.com/1000.html
しかし、最初のページには他のページへのリンクがありません。つまり、独立しています。
これどうやってするの?(私の英語でごめんなさい)
このようなもの:
class MySpider(BaseSpider):
name = 'example.com'
allowed_domains = ['example.com']
Start_urls = [
'http://www.example.com/1.html',
'http://www.example.com/2.html',
'http://www.example.com/3.html',
]
ただし、3 つ以上の異なるページの場合
ありがとう!