別の Web ページから大学とその Web サイトのリストを取得しようとしています。
必要な行ごとに HTML を表示するために入力を取得しましたが、テキストをさらにフォーマットしようとしています。大学名とその大学へのリンクのみを表示したい。何か案は?
これが私のコードです:
url = "http://www.arizona.edu/colleges"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
universities = soup.findAll('span', {'class' : 'field-content'})
for eachuniversity in universities:
print eachuniversity
そして、これが私が得るものの例ですeachuniversity
:
<div class="views-field-title">
<span class="field-content">
<a href="/colleges/college-agriculture-life-sciences">
<h3>College of Agriculture & Life Sciences</h3>
</a>
</span>
</div>