私はこのリンクを持っています:
http://www.brothersoft.com/windows/categories.html
div内のアイテムへのリンクを取得しようとしています。例:
http://www.brothersoft.com/windows/mp3_audio/midi_tools/
私はこのコードを試しました:
import urllib
from bs4 import BeautifulSoup
url = 'http://www.brothersoft.com/windows/categories.html'
pageHtml = urllib.urlopen(url).read()
soup = BeautifulSoup(pageHtml)
sAll = [div.find('a') for div in soup.findAll('div', attrs={'class':'brLeft'})]
for i in sAll:
print "http://www.brothersoft.com"+i['href']
しかし、私は出力しか得られません:
http://www.brothersoft.com/windows/mp3_audio/
必要な出力を取得するにはどうすればよいですか?