0

このサイトを見てほしい:

http://www.nhl.com/ice/teamstats.htm

今、私はここに私のコードを持っています。これは、テーブルの上部にあるすべてのヘッダーのみを出力します。

from bs4 import BeautifulSoup
from urllib.request import urlopen

url = urlopen("http://www.nhl.com/ice/teamstats.htm")

content = url.read()

soup = BeautifulSoup(content)

results = {}

for table in soup.find_all('table', class_='data stats'):
    for row in table.find_all('tr'):
        name = None
        for cell in row.find_all('th'):
            link = cell.find('a')
            if link:
                name = cell.a.string
                print (name)

確かに、これはもっと複雑です。多くの助けといくつかの忘れられた Python クラスの再学習により、この Web サイトでチームとスコアの関連付けを行うことができました: http://sports.yahoo.com/nhl/scoreboard?d=2013-04 -01

ただし、以前の Web ページ (最初のページ) には、それらの値に関連付けられた複数のヘッダーがあります。

私が求めているのは、その一部の要点を求めているだけです。そうすれば、残りの部分を問題なく (または、おそらくいくつかは知っているかもしれませんが) 達成できるようになります。ある意味で、これは私が達成したいことです:

Team X: GP: 30. W: 16. L: 4, etc.

ありがとう!

4

1 に答える 1