特定のサイトのテンプレートからデータを取得する方法に困惑しています。サイトへの URL は次のとおりです。http://www.dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1
、月は 1 月から始まります。ソースでは、テンプレートは id="homicide_template" として示されています。したがって、以下のコードを使用して、その特定のテンプレートとその要素を取得します。
import urllib2
import urllib
from bs4 import BeautifulSoup
url = urllib2.urlopen('http://dnainfo.com/chicago/2013-chicago-murders/timeline?mon=1')
html = url.read()
soup = BeautifulSoup(html)
site_template = soup.find(id="homicide_template")
print site_template
各人のテンプレートから年齢、人種、理由、近所、時間のデータを取得し、データベースまたは .csv ファイルに保存する方法がわかりません。これらのモジュール (urllib2 と BeautifulSoup 4) を使い始めたところです。そのため、ヘルプ/指示をいただければ幸いです。ありがとう。