0

匿名性の高いプロキシを特定しようとしています。プライベート/エリート プロキシとも呼ばれます。私がこれを読んだフォーラムから:

高匿名性 サーバーは、HTTP_X_FORWARDED_FOR、HTTP_VIA、および HTTP_PROXY_CONNECTION 変数を送信しません。ホストは、あなたがプロキシ サーバーを使用していることさえ知りませんし、もちろんあなたの IP アドレスも知りません。

匿名性の高いプロキシは、次の情報を表示します。

REMOTE_ADDR = プロキシの IP アドレス

HTTP_VIA = 空白

HTTP_X_FORWARDED_FOR = 空白

では、Python でこのヘッダーをチェックして、HA Proxy として破棄するにはどうすればよいでしょうか? パッケージを使用して、20〜30個のプロキシのヘッダーを取得しようとしましたがrequests、これもurllibを使用し、組み込みのhttp.clientを使用してurllib2を使用しました。しかし、私はこれらのヘッダーを見ませんでした。だから私は何か間違ったことをしているはずです...

これは私がテストに使用したコードですrequests:

proxies = {'http': 'http://176.100.108.214:3128'}
header = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.90 Safari/537.360',}
s = requests.session()
s.proxies = proxies
r = s.get('http://www.python.org', headers=header)
print(r.status_code)
print(r.request.headers)
print(r.headers)
4

1 に答える 1