私はコーディングにpythonを使用しています。私は、名前、チームの画像、および NBA ドラフト候補の大学を Web スクレイピングしようと試みてきましたが、大学の名前を探すと、大学のページと大学名の両方が得られます。大学だけが表示されるようにするにはどうすればよいですか? アンカー (anchor.string) の末尾に .string と .text を追加しようとしました。
import urllib2
from BeautifulSoup import BeautifulSoup
# or if your're using BeautifulSoup4:
# from bs4 import BeautifulSoup
list = []
soup = BeautifulSoup(urllib2.urlopen(
'http://www.cbssports.com/nba/draft/mock-draft'
).read()
)
rows = soup.findAll("table",
attrs = {'class':'data borderTop'})[0].tbody.findAll("tr")[2:]
for row in rows:
fields = row.findAll("td")
if len(fields) >= 3:
anchor = row.findAll("td")[2].findAll("a")[1:]
if anchor:
print anchor