urllib2、BeautifulSoup、および Python 2.7 を使用して Web ページを解析しようとしています。
問題は上流にあります。新しい Web ページを取得しようとするたびに、取得済みのページが取得されます。ただし、私の Web ブラウザーではページが異なります。ページ 1とページ 2を参照してください。ページ番号のループに何か問題がありますか?
コードサンプルは次のとおりです。
def main(page_number_max):
import urllib2 as ul
from BeautifulSoup import BeautifulSoup as bs
base_url = 'http://www.senscritique.com/clement/collection/#page='
for page_number in range(1, 1+page_number_max):
url = base_url + str(page_number) + '/'
html = ul.urlopen(url)
bt = bs(html)
for item in bt.findAll('div', 'c_listing-products-content xl'):
item_name = item.findAll('h2', 'c_heading c_heading-5 c_bold')
print str(item_name[0].contents[1]).split('\t')[11]
print('End of page ' + str(page_number) + '\n')
if __name__ == '__main__':
page_number_max = 2
main(page_number_max)