私は研究プロジェクトのためにデータを抽出していてfindAll('div', attrs={'class':'someClassName'})
、多くのWebサイトで成功裏に使用していますが、この特定のWebサイトは
attrsオプションを使用したときに値が返されません。しかし、attrsオプションを使用しないと、htmldom全体が取得されます。
これが私がそれをテストするために始めた簡単なコードです:
soup = bs(urlopen(url))
for div in soup.findAll('div', attrs={'class':'data'}):
print div