python - beautifulSoupを使用してWebサイトからすべての画像を抽出してダウンロードする方法は?

翻译自：https://stackoverflow.com/questions/18408307 2013-08-23T17:12:26.703

63079 次

URLからすべての画像を抽出してダウンロードしようとしています。スクリプトを書きました

import urllib2
import re
from os.path import basename
from urlparse import urlsplit

url = "http://filmygyan.in/katrina-kaifs-top-10-cutest-pics-gallery/"
urlContent = urllib2.urlopen(url).read()
# HTML image tag: <img src="url" alt="some_text"/>
imgUrls = re.findall('img .*?src="(.*?)"', urlContent)

# download all images
for imgUrl in imgUrls:
    try:
        imgData = urllib2.urlopen(imgUrl).read()
        fileName = basename(urlsplit(imgUrl)[2])
        output = open(fileName,'wb')
        output.write(imgData)
        output.close()
    except:
        pass

このページの画像を抽出したくありません。この画像を参照してくださいhttp://i.share.pho.to/1c9884b1_l.jpeg 「次へ」ボタンをクリックせずにすべての画像を取得したいだけです。「Next」クラス内のすべての写真を取得します。findall でどのような変更を行う必要がありますか?

python - beautifulSoupを使用してWebサイトからすべての画像を抽出してダウンロードする方法は?

3 に答える 3

Related

Reference