html - Beautiful Soup で次のページを解析するには?

翻译自：https://stackoverflow.com/questions/35796660 2016-03-04T12:55:58.363

1086 次

以下のコードを使用して、次のページでページを解析します。

def parseNextThemeUrl(url):
  ret = []
  ret1 = []
  html = urllib.request.urlopen(url)
  html = BeautifulSoup(html, PARSER)
  html = html.find('a', class_='pager_next')
  if html:
    html = urljoin(url, html.get('href'))
    ret1 = parseNextThemeUrl(html)

    for r in ret1:
        ret.append(r)
  else:
    ret.append(url)
  return ret

しかし、次のようなエラーが発生しました。リンクがある場合、次のリンクを解析するにはどうすればよいですか。

Traceback (most recent call last):
html = urllib.request.urlopen(url)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 162, in urlopen
return opener.open(url, data, timeout)
File "/Library/Frameworks/Python.framework/Versions/3.5/lib/python3.5/urllib/request.py", line 456, in open
req.timeout = timeout
AttributeError: 'list' object has no attribute 'timeout'

html - Beautiful Soup で次のページを解析するには?

1 に答える 1

Related

Reference