0

私はPythonが初めてで、コードについてほとんど混乱していません。

以下のコードでは、1 つのテーブルのすべてのリンクを取得しようとしています。これにより、すべてのリンクが得られます。コードは次のとおりです。

import mechanize
from BeautifulSoup import BeautifulSoup
i=0
url = "http://www.miamidade.gov/water/bill_app/bill_expired.asp"
br = mechanize.Browser()
br.open(url)
br.select_form(name="frm")
br["AcctId"] = '8428995632'
br.submit()
for link in br.links(url_regex="ID="):
    print link

同じページを印刷するためにもう 1 つのパラメーターを追加すると、以前に印刷されたすべてのリンクと、すべてのリンク ページに対して印刷したいデータが取得されません。以下はコードです。これらは余分な行です。追加しました

    billurl = "http://www.miamidade.gov/water/bill_app/"+link.url
    billdata = br.open(billurl)
    html = billdata.read()
    soup1 = BeautifulSoup(html)
    print soup1('font')[0].text[11:]
4

2 に答える 2