python - Python で複数のファイルをダウンロードする際のエラー

Question

誰が私が間違っているのか教えてもらえますか? このコードでエラーが発生し続けます。

実験として、 primaryschoolgamesからすべての swf をダウンロードしようとしていますが、できないようです。

#!/usr/bin/env python
# encoding: utf-8

import sys, getopt
import os, urllib, urllib2, re, string, math

help_message = '''
'''
no_param = '''
'''

verbose = False
fakeMode = False
curPath = os.getcwd() + "/"

urlRegex = ''
FileRegex = ''
outputPath = ''
currentFile = ''

def removeDuplicates(seq):
# Not order preserving
keys = {}
for e in seq:
    keys[e] = 1
return keys.keys()

def go(filename):
print "Having a look at " + string.capwords(filename)

global urlRegex, FileRegex, outputPath, currentFile

url = 'http://cdn.primarygames.com' + filename

urlRegex = '/'+filename+'/.+/download'
FileRegex = '/'+filename+'/(.*?)/download'
outputPath = curPath+"Swfs"+"/"

if not os.path.exists(outputPath):
    os.makedirs(outputPath)

filelist = []

while(len(url)):
    # looping system
    newlist, url = scrapePage(url, filename)
    filelist.extend(newlist)

print 'Found %s Files.' % len(filelist)

for swf in filelist:
    swfurl = swf['url']
    name = swf['name']
    currentFile = name
    #print 'Downloading '+name,
    if not fakeMode:
        #print ''
        urllib.urlretrieve('http://cdn.primarygames.com' + swfurl, outputPath+name)
    else:
        print 'Not downloading %s.' % name
print "All done with %s!" % filename

def scrapePage(url, filename):
print 'Looking through '+url
html = urllib2.urlopen(url).read()
swflist = re.findall(urlRegex, html)
swflist = removeDuplicates(swflist)

swfs = []

for swfurl in swflist:
    r = re.compile(FileRegex)
    swfname = r.search(swfurl).group(1)
    swfname = swfname.replace('-', ' ')
    name = filename + "/" + swfname + ".swf"
    name = string.capwords(name)
    swf.append({'name':name,'url':swfurl})

r = re.compile(nextRegex)
result = r.search(html)
if result:
    nextUrl = 'http://cdn.primarygames.com' + result.group(1)
else:
    nextUrl = ''

return swfs, nextUrl


def main(argv=None):
global verbose, fakeMode

if argv is None:
    argv = sys.argv
try:
    try:
        opts, args = getopt.getopt(argv[1:], "ho:vf", ["help", "output="])
    except getopt.error, msg:
        raise Usage(msg)

    # option processing
    for option, value in opts:
        if option == "-v":
            verbose = True
        if option in ("-f", "--fake"):
            fakeMode = True
        if option in ("-h", "--help"):
            raise Usage(help_message)
        if option in ("-o", "--output"):
            output = value

    if len(args):
        swfs = args
    else:
        raise Usage(no_param)

except Usage, err:
    print >> sys.stderr, sys.argv[0].split("/")[-1] + ": " + str(err.msg)
    if err.msg != help_message:
        print >> sys.stderr, "\t for help use --help"
    return 2

for swf in swfs:
    go(swf)


if __name__ == "__main__":
sys.exit(main())

これは私が取得し続けるエラーです:

Having a look at *
Looking through http://cdn.primarygames.com/*
Traceback (most recent call last):
File "C:\PrimarySchoolGames Swf Downloader.py"
, line 129, in <module>
sys.exit(main())
File "C:\PrimarySchoolGames Swf Downloader.py"
, line 125, in main
go(swf)
File "C:\PrimarySchoolGames Swf Downloader.py"
, line 48, in go
newlist, url = scrapePage(url, filename)
File "C:\Users\Terrii\Desktop\VB Extra's\PrimarySchoolGames Swf Downloader.py"
, line 67, in scrapePage
html = urllib2.urlopen(url).read()
File "C:\Python27\lib\urllib2.py", line 126, in urlopen
return _opener.open(url, data, timeout)
File "C:\Python27\lib\urllib2.py", line 400, in open
response = self._open(req, data)
File "C:\Python27\lib\urllib2.py", line 418, in _open
'_open', req)
File "C:\Python27\lib\urllib2.py", line 378, in _call_chain
result = func(*args)
File "C:\Python27\lib\urllib2.py", line 1207, in http_open
return self.do_open(httplib.HTTPConnection, req)
File "C:\Python27\lib\urllib2.py", line 1177, in do_open
raise URLError(err)
urllib2.URLError: <urlopen error [Errno 11004] getaddrinfo failed>

score 1 · Accepted Answer

通常、失敗しgetaddrinfoた場合は、指定した URL に何か問題があることを示しています。アドレスを解決できたので、プロキシサーバーの背後にいないのは確かですか? これにより、DNS ルックアップが失敗し、まさにこのメッセージが表示される可能性があります。

Python が Windows で使用するプロキシを決定する方法:

Windows 環境では、プロキシ環境変数が設定されていない場合、プロキシ設定はレジストリのインターネット設定セクションから取得されます。

詳細については、@MikeHunter に同意します。コードを修正しようとしましたが、コードを実行するために Exception-Class を実装する必要があったため、コードを再インデントして詳細情報を提供する必要があると思います。ごめん。

python - Python で複数のファイルをダウンロードする際のエラー

1 に答える 1

Related

Reference