1

こんにちは、私は学校で HTML を削り取るプロジェクトに取り組んでいます。

ただし、テーブルを探しても何も返されません。問題が発生しているセグメントは次のとおりです。

さらに情報が必要な場合は、喜んで提供します

from bs4 import BeautifulSoup
import urllib2
import datetime

#This section determines the date of the next Saturday which will go onto the end of     the URL 
d = datetime.date.today() 
while d.weekday() != 5:
    d += datetime.timedelta(1)

#temporary logic for testing when next webpage isn't out
d = "2013-06-01"

#Section that scrapes the data off the webpage
url = "http://www.sydgram.nsw.edu.au/co-curricular/sport/fixtures/" + str(d) + ".php"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page)
print soup
#Section that grabs the table with stuff in it
table = soup.find('table', {"class": "excel1"})
print table
4

1 に答える 1

0

BeautifulSoup は HTML の文字列を期待しています。あなたが提供するのは応答オブジェクトです。

応答から html をフェッチします。

 html = page.read()

そしてhtmlをbeautifulsoupに渡すか、好きなように直接渡します。

さらに、次の 2 つのリンクを読むことをお勧めします。

urllib2 ドキュメント

BeautifulSoup のドキュメント

于 2013-06-04T12:36:41.163 に答える