python - すべてのリンクを正しく取得できません

翻译自：https://stackoverflow.com/questions/18458259 2013-08-27T06:16:02.087

111 次

私はPythonが初めてで、コードについてほとんど混乱していません。

以下のコードでは、1 つのテーブルのすべてのリンクを取得しようとしています。これにより、すべてのリンクが得られます。コードは次のとおりです。

import mechanize
from BeautifulSoup import BeautifulSoup
i=0
url = "http://www.miamidade.gov/water/bill_app/bill_expired.asp"
br = mechanize.Browser()
br.open(url)
br.select_form(name="frm")
br["AcctId"] = '8428995632'
br.submit()
for link in br.links(url_regex="ID="):
    print link

同じページを印刷するためにもう 1 つのパラメーターを追加すると、以前に印刷されたすべてのリンクと、すべてのリンクページに対して印刷したいデータが取得されません。以下はコードです。これらは余分な行です。追加しました

    billurl = "http://www.miamidade.gov/water/bill_app/"+link.url
    billdata = br.open(billurl)
    html = billdata.read()
    soup1 = BeautifulSoup(html)
    print soup1('font')[0].text[11:]

python - すべてのリンクを正しく取得できません

2 に答える 2

Related

Reference