0

このリンクからbeautifulSoupを使用して「Perkins College...」という学校名を取得したいと思います。

私が使用するコードは何も返しません。

school = soup.find('a','profiles-show-school-name-sm-link')
print 'school: ', school
print 'school.text: ', school.text

出力:

school:  <a class="profiles-show-school-name-sm-link" href="/profiles/show/online-degrees/stephen-f-austin-state-university/perkins-college-of-education-undergraduate/395/5401">
<img border="0" src="/images/profiles/243x60/4613/degrees/undergraduate-certificate-in-hospitality-administration.png"/>
</a>
school.text:  

学校名 (URL ではない) を抽出するための BeautifulSoup 実装の提案はありますか? どうも!

4

1 に答える 1

1
school = soup.find('a','profiles-show-school-name-sm-link')
url = school['href']

学校が常に URL の同じ場所にあると仮定します。

for i in range(5):
   url = url[url.find("/")+1:]
schoolname = url[:url.find("/")]
print " ".join(schoolname.split("-")).title()

収量:

Perkins College Of Education Undergraduate

大学を取得する

for i in range(4):
   url = url[url.find("/")+1:]
university= url[:url.find("/")]
print " ".join(university.split("-")).title()

収量:

Stephen F Austin State University
于 2013-07-31T14:37:43.833 に答える