urllib2
HTTP アクセス ライブラリとしての使用からライブラリの使用に切り替えましたrequest
。BeautifulSoup
関数を使用してhtml要素をプルするために使用するurllibではfindAll(tag='element')
、同じ方法でBeautifulSoupを使用し続けますか、それともリクエストにはこのプロセスを簡素化する関数がありますか?
urllib2 を使用してタグをプルする
import urllib2
from bs4 import BeautifulSoup as BS
response = urllib2.urlopen('http://stackoverflow.com/')
soup = BS(response)
for a in soup.findAll('a'):
print a['href]
リクエストを使用してタグをプルする
import response
response = request.get('http://stackoverflow.com/')
for a in response.findAll('a'):
print a['href]