このサイトを見てほしい:
http://www.nhl.com/ice/teamstats.htm
今、私はここに私のコードを持っています。これは、テーブルの上部にあるすべてのヘッダーのみを出力します。
from bs4 import BeautifulSoup
from urllib.request import urlopen
url = urlopen("http://www.nhl.com/ice/teamstats.htm")
content = url.read()
soup = BeautifulSoup(content)
results = {}
for table in soup.find_all('table', class_='data stats'):
for row in table.find_all('tr'):
name = None
for cell in row.find_all('th'):
link = cell.find('a')
if link:
name = cell.a.string
print (name)
確かに、これはもっと複雑です。多くの助けといくつかの忘れられた Python クラスの再学習により、この Web サイトでチームとスコアの関連付けを行うことができました: http://sports.yahoo.com/nhl/scoreboard?d=2013-04 -01
ただし、以前の Web ページ (最初のページ) には、それらの値に関連付けられた複数のヘッダーがあります。
私が求めているのは、その一部の要点を求めているだけです。そうすれば、残りの部分を問題なく (または、おそらくいくつかは知っているかもしれませんが) 達成できるようになります。ある意味で、これは私が達成したいことです:
Team X: GP: 30. W: 16. L: 4, etc.
ありがとう!