python - 正しいライブラリの使用法: bs4.BeautifulSoup を使用したリクエスト?

Question

urllib2HTTP アクセスライブラリとしての使用からライブラリの使用に切り替えましたrequest。BeautifulSoup関数を使用してhtml要素をプルするために使用するurllibではfindAll(tag='element')、同じ方法でBeautifulSoupを使用し続けますか、それともリクエストにはこのプロセスを簡素化する関数がありますか?

urllib2 を使用してタグをプルする

import urllib2
from bs4 import BeautifulSoup as BS

response = urllib2.urlopen('http://stackoverflow.com/')
soup = BS(response)

for a in soup.findAll('a'):
    print a['href]

リクエストを使用してタグをプルする

import response

response = request.get('http://stackoverflow.com/')

for a in response.findAll('a'):
    print a['href]

score 1 · Accepted Answer

requestは、特にリダイレクトなどがある場合に、URL からのデータの取得を容易にするだけです。の本文を解析しません。HTMLそれでも、それを実行してBeautifulSoup、そのインポートを 2 番目のコードフラグメントに追加する必要があります。、および次のようなもの：

soup = BS(response.text)

python - 正しいライブラリの使用法: bs4.BeautifulSoup を使用したリクエスト?

1 に答える 1

Related

Reference