2

http プロキシと Mechanize モジュールを使用しています。mechanize オブジェクトを初期化し、次のようにプロキシを設定します。

self.br = mechanize.Browser()
self.br.set_proxies({"http": proxyAddress})   #proxy address is like 1.1.1.1:8080

次に、次のようにサイトを開きます。

response = self.br.open("http://google.com")

私の問題は、機械化がプロキシを完全に無視しているように見えることです。br オブジェクトをデバッグして調べると、プロキシ ハンドラの下にプロキシ設定が表示されます。ただし、私が悪いプロキシを指定しても、Mechanize はプロキシを設定しなかったかのように動作します。何を与える?

編集:私も試しました:

mechanize.install_opener(mechanize.build_opener(mechanize.ProxyHandler({'http': "127.0.0.1:99"})))
response = mechanize.urlopen("http://google.com")

また、私のプロキシも無視しているようです。(有効なプロキシを指定していませんでした。URLError で失敗するべきではありませんか?)

4

2 に答える 2

1

メーリングリストで話した後、それを理解しました:

import mechanize
browser = mechanize.Browser()
browser.set_proxies(proxies={"http": "myproxy.example.com:1234"},
                proxy_bypass=lambda hostname: False)
于 2011-02-16T04:21:56.330 に答える
0

https サイトにアクセスしようとしている場合は、br = mechanize.Browser() に従ってプロキシを https として設定します。

    # Cookie Jar
    cj = cookielib.LWPCookieJar()
    br.set_cookiejar(cj)

    # Browser options
    br.set_handle_equiv(True)
    br.set_handle_gzip(True)
    br.set_handle_redirect(True)
    br.set_handle_referer(True)
    br.set_handle_robots(False)

    # Follows refresh 0 but not hangs on refresh > 0
    br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)

    # Want debugging messages?
    #br.set_debug_http(True)
    #br.set_debug_redirects(True)
    #br.set_debug_responses(True)

    # User-Agent (this is cheating, ok?)
    br.addheaders = [('User-agent', 'Mozilla/4.0 (Compatible; MSIE 8.0; Windows NT 5.2; Trident/6.0)')]

    br.set_proxies({"https": "XXX.XX.246.56:33835"})
于 2019-03-28T10:44:03.477 に答える