すべてのページ内のすべてのアプリケーション リンクを取得したいのですが、問題は、各カテゴリ内の合計ページが同じではないことです。私はこのコードを持っています:
import urllib
from bs4 import BeautifulSoup
url ='http://www.brothersoft.com/windows/mp3_audio/'
pageUrl = urllib.urlopen(url)
soup = BeautifulSoup(pageUrl)
for a in soup.select('div.coLeft.cate.mBottom dd a[href]'):
print 'http://www.brothersoft.com'+a['href'].encode('utf-8','repalce')
suburl = 'http://www.brothersoft.com'+a['href'].encode('utf-8','repalce')
for page in range(1,27+1):
content = urllib.urlopen(suburl+'{}.html'.format(page))
soup = BeautifulSoup(content)
for a in soup.select('div.freeText dl a[href]'):
print 'http://www.brothersoft.com'+a['href'].encode('utf-8','repalce')
しかし、各カテゴリで 27 ページのアプリケーションのリンクしか取得できません。他のカテゴリに 27 ページがない場合、または 27 ページを超えている場合はどうなりますか?