django - lxml を使用して Web サイトからメッセージを取得するには?

Question

Exam.com は天気に関するものではありません。

Tokyo: 25°C

Django 1.1とlxmlを使用して Web サイトで情報を取得したいと考えています。「25」だけの情報が欲しい。

次のようなHTMLのexam.com構造：

<p id="resultWeather">
    <b>Weather</b>
    Tokyo:
    <b>25</b>°C
</p>

私は学生です。私は友達と小さなプロジェクトをやっています。分かりやすく教えてください。どうもありがとうございました！

score 4 · Accepted Answer

BeautifulSoup は、lxml よりも html の解析に適しています。

このようなものが役立ちます：

def get_weather():
    import urllib
    from BeautifulSoup import BeautifulSoup
    data = urllib.urlopen('http://exam.com/').read()
    soup = BeautifulSoup(data)
    return soup.find('p', {'id': 'resultWeather'}).findAll('b')[-1].string

urllib でページコンテンツを取得し、BeautifulSoup で解析し、id=resultWeather で P を見つけ、P の最後の B を見つけてコンテンツを取得します。

django - lxml を使用して Web サイトからメッセージを取得するには?

1 に答える 1

Related

Reference