0

Exam.com は天気に関するものではありません。

Tokyo: 25°C

Django 1.1lxmlを使用して Web サイトで情報を取得したいと考えています。「25」だけの情報が欲しい。

次のようなHTMLのexam.com構造:

<p id="resultWeather">
    <b>Weather</b>
    Tokyo:
    <b>25</b>°C
</p>

私は学生です。私は友達と小さなプロジェクトをやっています。分かりやすく教えてください。どうもありがとうございました!

4

1 に答える 1

4

BeautifulSoup は、lxml よりも html の解析に適しています。

このようなものが役立ちます:

def get_weather():
    import urllib
    from BeautifulSoup import BeautifulSoup
    data = urllib.urlopen('http://exam.com/').read()
    soup = BeautifulSoup(data)
    return soup.find('p', {'id': 'resultWeather'}).findAll('b')[-1].string

urllib でページ コンテンツを取得し、BeautifulSoup で解析し、id=resultWeather で P を見つけ、P の最後の B を見つけてコンテンツを取得します。

于 2009-10-30T08:03:29.380 に答える