python - urllib2 と BeautifulSoup を使用して Web サイトのテンプレートからデータを取得しようとしています

翻译自：https://stackoverflow.com/questions/18406904 2013-08-23T15:47:11.487

194 次

特定のサイトのテンプレートからデータを取得する方法に困惑しています。サイトへの URL は次のとおりです。http://www.dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1

、月は 1 月から始まります。ソースでは、テンプレートは id="homicide_template" として示されています。したがって、以下のコードを使用して、その特定のテンプレートとその要素を取得します。

import urllib2
import urllib
from bs4 import BeautifulSoup


url =  urllib2.urlopen('http://dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1')
html = url.read()


soup = BeautifulSoup(html)
site_template = soup.find(id="homicide_template")

print site_template

各人のテンプレートから年齢、人種、理由、近所、時間のデータを取得し、データベースまたは .csv ファイルに保存する方法がわかりません。これらのモジュール (urllib2 と BeautifulSoup 4) を使い始めたところです。そのため、ヘルプ/指示をいただければ幸いです。ありがとう。

python - urllib2 と BeautifulSoup を使用して Web サイトのテンプレートからデータを取得しようとしています

1 に答える 1

Related

Reference