Web サイトからデータをスクレイピングしようとしましたが、find() メソッドでタグが見つかりません。コードは次のとおりです。
import urllib2
from bs4 import BeautifulSoup
url='http://www.jbhifi.com.au/computers/laptop-notebook/'
req=urllib2.Request(url,headers={'User-Agent':'Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.76 Safari/537.36'})
webpage=urllib2.urlopen(req)
content=webpage.read()
soup=BeautifulSoup(content)
x=soup.find("div",attrs={'id':'content-two'})
print x #return None
すると、HTMLのみの美しいパーサーヘッドを発見
head=soup.find('head')
print head # print out content within <head>tag
body=soup.find('body')
print body # Print None
私は本当に混乱しています。これまでにbeautifulsoupを数回使用しましたが、この問題に遭遇したのはこれが初めてです。誰でもこの問題を解決する方法を知っていますか? ありがとうございました。
問題は解決しました。Beautifulsoup 4.2 をアンインストールしてから、beautifulsoup 4.3 をインストールしました。コードが動作するようになりました。