-6

私はPythonを初めて使用し、Webサーバーからデータを解析する最良の方法は何なのか疑問に思っています. 私はグーグルで検索しましたが、適切なチュートリアルは見つかりませんでした。

4

1 に答える 1

2

を使用できますBeatifulSoap

Beautiful Soup は、HTML および XML ファイルからデータを引き出すための Python ライブラリです。お気に入りのパーサーと連携して、解析ツリーをナビゲート、検索、および変更する慣用的な方法を提供します。通常、プログラマーの作業時間を数時間または数日節約します。

ドキュメンテーション

使用例:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen('http://facebook.com').read()
soup = BeautifulSoup(page)
soup.prettify()
for anchor in soup.findAll('a', href=True):
   print anchor['href']
于 2013-01-02T13:07:39.797 に答える