2

urllib2HTTP アクセス ライブラリとしての使用からライブラリの使用に切り替えましたrequestBeautifulSoup関数を使用してhtml要素をプルするために使用するurllibではfindAll(tag='element')、同じ方法でBeautifulSoupを使用し続けますか、それともリクエストにはこのプロセスを簡素化する関数がありますか?


urllib2 を使用してタグをプルする


import urllib2
from bs4 import BeautifulSoup as BS

response = urllib2.urlopen('http://stackoverflow.com/')
soup = BS(response)

for a in soup.findAll('a'):
    print a['href]

リクエストを使用してタグをプルする


import response

response = request.get('http://stackoverflow.com/')

for a in response.findAll('a'):
    print a['href]
4

1 に答える 1

1

requestは、特にリダイレクトなどがある場合に、URL からのデータの取得を容易にするだけです。 の本文を解析しません。HTMLそれでも、それを実行してBeautifulSoup、そのインポートを 2 番目のコード フラグメントに追加する必要があります。 、および次のようなもの:

soup = BS(response.text)
于 2013-03-21T07:30:20.943 に答える