Webサイトの最初の100ページをクロールするクローラーを作成しようとしています。
私のコードは次のようなものです:
def extractproducts(pagenumber):
contenturl = "http://websiteurl/page/" + str(pagenumber)
content = BeautifulSoup(urllib2.urlopen(contenturl).read())
print pagehtml
pagenumberlist = range(1, 101)
for pagenumber in pagenumberlist:
extractproducts(pagenumber)
この状況でスレッドモジュールを使用して、urllibが複数のスレッドを使用して一度にX個のURLをクロールするようにするにはどうすればよいですか?
/ newb out