-1

誰かが私にコードを見せてもらえますか.30分ごとにGoogleから最近のニュースを取得し、Pythonを使用して私のウェブサイトに表示するとしましょう?

44 のビデオ チュートリアルを見て、基本的なことを学びました。

例は次のとおりです。

import urllib2
from BeautifulSoup import BeautifulSoup
# or if your're using BeautifulSoup4:
# from bs4 import BeautifulSoup

soup = BeautifulSoup(urllib2.urlopen('http://www.timeanddate.com/worldclock/astronomy.html?n=78').read())

for row in soup('table', {'class' : 'spad'})[0].tbody('tr'):
  tds = row('td')
  print tds[0].string, tds[1].string
  # will print date and sunrise

しかし、私のような初心者は、このコードが上記の例を解決するのにどのように役立つかを理解できません。

4

2 に答える 2

3

これは、Google ニュースから 30 分ごとに主要なタイトルをすべて取得して出力する簡単な例です。それらをあなたのウェブサイトに表示する方法は、実装方法によって異なります。たとえば、MYSQL データベースからコンテンツを取得する場合、このスクリプトを簡単に作成して、新しいタイトルをダウンロードするたびに DB を更新できます。

import mechanize
import cookielib
import lxml.html as lh
import time  

br = mechanize.Browser()
cj = cookielib.LWPCookieJar()
br.set_cookiejar(cj)
br.set_handle_equiv(True)
br.set_handle_gzip(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]

while True:
    r = br.open('https://news.google.com/')
    html = r.read()
    doc=lh.fromstring(html)
    for i in doc.xpath('.//*[@class="esc-lead-article-title"]'):
        print i.text_content()
    time.sleep(1800)
于 2012-10-19T18:29:28.833 に答える
1

よく知らないものの import ステートメントを見つけたときはいつでも、すばやく Google 検索を行うのが賢明です。私の収穫

美しいスープ。ここでは、美しいスープとして知られる python ライブラリのドキュメントを読むことができます。

UrlLib2は、URL を開くために使用されるライブラリです。

ドキュメントを読むと、この小さなスニペットをどのように活用できるかを理解するのに役立つはずです:)。

于 2012-10-19T17:17:09.240 に答える