ページhttp://sports.yahoo.com/nhl/scoreboard?d=2013-04-01からチームとすべてのスコア値 (スペースなし) を出力するコードがあります。
from bs4 import BeautifulSoup
from urllib.request import urlopen
url = urlopen("http://sports.yahoo.com/nhl/scoreboard?d=2013-04-01")
content = url.read()
soup = BeautifulSoup(content)
listnames = ''
listscores = ''
for table in soup.find_all('table', class_='scores'):
for row in table.find_all('tr'):
for cell in row.find_all('td', class_='yspscores'):
if cell.text.isdigit():
listscores += cell.text
for cell in row.find_all('td', class_='yspscores team'):
listnames += cell.text
print (listnames)
print (listscores)
私が解決できない問題は、Python が抽出された情報をどのように使用して、正しいチームに正しい整数値を次のような形式で与えることができるかをよく理解していないことです。
Team X: 1, 5, 11.
Web サイトの問題は、すべてのスコアが同じクラスに属していることです。すべてのテーブルが同じクラスの下にあります。唯一の違いは、href です。