1

小さな autoposter スクリプトを作成しようとしました。Web ページからすべての入力を見つけて印刷する必要があります。mechanize図書館を利用しようとしています。

私はこのスクリプトを書きました:

import urllib  
import cookielib  
import mechanize  

url = "https://www.sito.com/page.html"  

cookie = cookielib.CookieJar()  
browser = mechanize.Browser()  

browser.set_cookiejar(cookie)  
browser.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)  

browser.open(url)  

for f  in browser.forms():  
    print f.name

mechanizeWebページからのすべての入力を、またはおそらく別のライブラリで印刷するにはどうすればよいですか?

4

1 に答える 1

0

urllib2+だけを使用してみませんかBeautifulSoup:

import urllib2
from bs4 import BeautifulSoup

url = "http://sito.com/SitoContact.htm"  # change to whatever your url is

page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)

for i in soup.find_all('input'):
    print i

参考までに、ssl エラーのため、ご提供いただいたページにアクセスできませんでした。そのため、例では別の URL を使用しています。

フォームに入力する必要がある場合、または入力でいくつかのアクションを実行する必要がある場合は、mechanizeまたは同様のツールが必要になることに注意してください。BeautifulSoupしかし、いずれにせよ、引き続きhtml の解析に使用できます。また、Seleniumプロジェクトもご覧ください。

于 2013-09-05T20:49:45.227 に答える