URLからすべての画像を抽出してダウンロードしようとしています。スクリプトを書きました
import urllib2
import re
from os.path import basename
from urlparse import urlsplit
url = "http://filmygyan.in/katrina-kaifs-top-10-cutest-pics-gallery/"
urlContent = urllib2.urlopen(url).read()
# HTML image tag: <img src="url" alt="some_text"/>
imgUrls = re.findall('img .*?src="(.*?)"', urlContent)
# download all images
for imgUrl in imgUrls:
try:
imgData = urllib2.urlopen(imgUrl).read()
fileName = basename(urlsplit(imgUrl)[2])
output = open(fileName,'wb')
output.write(imgData)
output.close()
except:
pass
このページの画像を抽出したくありません。この画像を参照してくださいhttp://i.share.pho.to/1c9884b1_l.jpeg 「次へ」ボタンをクリックせずにすべての画像を取得したいだけです。 「Next」クラス内のすべての写真を取得します。findall でどのような変更を行う必要がありますか?