0

Facebookにアクセスするために個人的に使用するためのwebproxyを作成しようとしています(たまたま時間を過ごすいくつかの場所からブロックされることがよくあります)。

このコードから開始: http://code.google.com/p/gevent/source/browse/examples/webproxy.py?name=1.0b2

次の方法で urllib をリクエストに置き換えて、Cookie で動作するように変更しました。

def proxy_post(path, env, proxy_url, start_response):
    if '://' not in path:
        path = 'http://' + path
    try:
        #response = br.submit(path, env)
        response = requests.post(path, params = env)
        print '%s: %s' % (path, response)
        headers = [(k, v) for (k, v) in response.headers.items() if k not in drop_headers]
        scheme, netloc, path, params, query, fragment = urlparse(path)
        host = (scheme or 'http') + '://' + netloc
    except Exception, ex:
        sys.stderr.write('error while reading %s:\n' % path)
        traceback.print_exc()
        tb = traceback.format_exc()
        error_str = escape(str(ex) or ex.__class__.__name__ or 'Error')
        return ['<h1>%s</h1><h2>%s</h2><pre>%s</pre>' % (error_str, escape(path), escape(tb))]
    else:
        start_response('%s OK' % response.status_code, headers)
        data = response.content
        data = fix_links(data, proxy_url, host)
        return [data]

しかし、ログインしようとすると、次のエラーが表示されます。

Traceback (most recent call last):
  File "/usr/local/lib/python2.7/dist-packages/gevent/wsgi.py", line 116, in handle
    self.data.extend(result)
TypeError: 'NoneType' object is not iterable
<WSGIServer fileno=3 address=0.0.0.0:8088>: Failed to handle request:
  request = <http_request "POST /https://www.facebook.com/login.php?login_attempt=1 HTTP/1.1" 127.0.0.1:56381>
  application = <function application at 0x2be2578>

127.0.0.1 - - [2013-04-13 20:08:03] "POST /https://www.facebook.com/login.php?login_attempt=1 HTTP/1.1" 500 21 "http://127.0.0.1:8088/http://www.facebook.com" "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:20.0) Gecko/20100101 Firefox/20.0"

私の推測では、WSGI 応答の作成中に何らかの問題が発生したために発生しましたが、その理由を正確に把握できました。

4

1 に答える 1

0

あなたが言及したwebproxyを見てみました。内部def application(env, start_response):には次のコードがあります。

 elif (method, path) == ('POST', ''):
    key, value = env['wsgi.input'].read().strip().split('=')
    assert key == 'url', repr(key)
    start_response('302 Found', [('Location', join(proxy_url, unquote(value)))])
elif method == 'POST':
    start_response('404 Not Found', [])

したがって、メソッドがPOSTあり、パスが空でない場合は、404が返されます。あなたが添付した応答によるとPOST、パス/https://www.facebook.com/login.php?login_attempt=1でメソッドを使用しています。そこで検索を開始します。これは、 と によって返される結果の違いと共通する sth を持っている可能性がurllib2.open()ありmechanize.Browser().open()ます。

補足: sth はそのパスで間違っています。 / https://www.facebook.com/で開始しないでください。

于 2013-04-12T10:39:11.337 に答える