私はPythonが初めてで、コードについてほとんど混乱していません。
以下のコードでは、1 つのテーブルのすべてのリンクを取得しようとしています。これにより、すべてのリンクが得られます。コードは次のとおりです。
import mechanize
from BeautifulSoup import BeautifulSoup
i=0
url = "http://www.miamidade.gov/water/bill_app/bill_expired.asp"
br = mechanize.Browser()
br.open(url)
br.select_form(name="frm")
br["AcctId"] = '8428995632'
br.submit()
for link in br.links(url_regex="ID="):
print link
同じページを印刷するためにもう 1 つのパラメーターを追加すると、以前に印刷されたすべてのリンクと、すべてのリンク ページに対して印刷したいデータが取得されません。以下はコードです。これらは余分な行です。追加しました
billurl = "http://www.miamidade.gov/water/bill_app/"+link.url
billdata = br.open(billurl)
html = billdata.read()
soup1 = BeautifulSoup(html)
print soup1('font')[0].text[11:]